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从 力学 、 物 理学 、 天 文学 直到 化 学 、 生 物 学 、 经 济 
学 与 工程 技术 ， 无 不 用 到 数学 ， 一 个 人 从 入 小 学 到 大 学 
毕业 的 十 六 年 中 ， 有 十 三 、 四 年 有 数学 课 。 可 见 数 学 之 
重要 与 其 应 用 之 广泛 。 

但 提起 数学 ， 不 少 人 仍 觉得 头痛 ， 难 以 入 门 ， 甚 至 
望 而 生 县 。 我 以 为 要 克服 这 个 鸿沟 ， 还 是 有 可 能 的 , 近 
代数 学 难于 接触 ,原因 之 一 大 概 是 由 于 其 符号 .语言 与 概 
念 耻 生 ， 兼 之 近代 数学 的 高 度 抽象 与 概括 ， 难 于 了 解 与 
掌握 。 我 想 ， 如 果 知 道 讨论 的 对 象 的 具体 背景 ， 风 有 可 
能 掌握 其 实质 。 显然 ， 一 个 非 数 学 专业 出 身 的 人 ， 要 把 
数学 专业 的 教科 书 都 自修 一 遍 ， 这 在 时 间 与 精力 上 都 不 
易 做 到 . 若 停留 在 初等 数学 水 平 上 , 骂 怕 做 了 很 多 难题 ， 
似 亦 不 会 有 助 于 对 近代 数学 的 了 解 。 这 就 促使 我 们 设想 
出 一 套 “ 走 向 数学 ”小 丛书， 其 中 每 本 小 册子 尽量 用 深 
入 滥 出 的 语言 来 讲述 数学 的 某 一 问题 或 方面 ， 使 工程 技 
术 人 员 ， 非 数学 专业 的 大 学 生 ， 甚 至 具有 中 学 数学 水 平 
的 人 , 亦 能 懂得 书 中 全 部 或 部 分 食 义 与 内 容 .这 对 提高 我 
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国人 民 的 数学 修养 与 水 平 ， 可 能 会 起 些 作用 ,显然 ,要 将 
一 门 数 学 深入 浅 出 地 讲 出 来 , 决 非 易 事 ,首先 要 对 这 门 数 
学 有 深入 的 研究 与 透彻 的 了 解 ,从 整体 上 说 ,我 国 的 数学 
水 平 还 不 高 ,能 否 较 好 地 完成 这 一 任务 还 难说 ,但 我 了 解 
很 多 数学 家 的 积极 性 很 高 ， 他 们 愿意 为 “走向 数学 ”所 
稿 .这 很 值得 高 兴 与 欢迎 ， 

承蒙 国家 自然 科学 基金 委员 会 、 中 国 数 学 会 数学 传 
播 委 员 会 与 湖南 教育 出 版 社 的 支持 ， 得 以 出 版 这 套 “ 走 
向 数学 ”从 书 ， 谨 致 以 感谢 。 


序 ， 现 代 电子 计算 机 中 
的 几 个 数学 问题 


在 这 本 小 册子 里 我 们 收集 了 10 篇 与 电子 计算 机 科学 有 关 的 
数学 问题 ， 我 们 介绍 这 些 问 题 的 主要 原因 是 我 位 曾 做 过 这 些 方 
面 的 研究 或 常常 读 到 别人 报导 这 一 类 的 问题 ， 当 我 们 发 现 它 们 
可 以 用 较 浅显 的 文字 有 趣 地 写 出 来 时 ， 我 们 就 陆续 地 写 ， 其 中 
前 面 五 篇 都 在 < 数学 传播 > (台湾 中 央 研 究 院 数学 研究 所 编 的 一 
个 刊物 ， 后 同 ,) 上 发 表 过 ， 不 过 收集 在 本 书 中 时 ， 我 们 咯 有 增 
删 ， 为 的 是 方便 读者 的 阅读 ， 

计算 机 与 数学 有 一 个 共同 点 ， 就 是 要 条 理 分 明 ,一丝 不 苟 。 
讲 不 清楚 的 东西 不 算数 学 ， 也 无 法 叫 计算 机 运转 计算 ， 即 使 要 
描写 一 种 模糊 的 观念 ， 都 得 描述 得 清 清楚 楚 〈 参 看 第 六 章 模糊 
集 浅 介 )。 由 于 计算 机 的 性 能 愈 来 您 强 ,可 以 应 用 的 范围 也 就 愈 
来 愈 大 ， 数 学 也 就 用 得 更 多 。 以往 应 用 数学 多 半 是 指 物 理工 程 
方面 的 微分 方程 式 ， 偏 重 于 解析 数学 ， 现 代 计 算 机 所 要 用 到 的 
数学 几乎 无 所 不 包 ， 数 论 、 抽 象 代数 及 几何 都 有 重要 的 用 途 , 
特别 是 现 有 的 数学 技巧 还 不 够 应 什 巨 大 计算 量 的 处 理 实际 问 
题 ， 仍 需要 沿 前 发 展 、 突 破 ， 获 得 新 的 数学 理论 及 应 用 。 

本 册 所 收集 的 只 和 包括， 一、 计算 机 信号 传递 的 正确 性 与 保 
密 性 (第 一 ， 二 ， 三 ， 五 ， 八 ， 九 章 ); 二 、 计 算 机 快速 计算 问 
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题 ( 第 四 及 第 七 章 ); 三 、 计 算 机 处 理 模糊 问题 的 数学 (第 六 章 )， 
四 、 统 计 学 与 模拟 实验 (第 十 章 )。 虽 材料 有 限 ， 但 至 少 可 以 略 
帘 数 学 在 计算 机 上 应 用 的 梗概 及 其 进展 。 

此 书 前 九 章 原由 台湾 知识 系统 出 版 社 发 行 ， 为 其 电脑 丛书 
之 一 ， 今 很 高 兴 此 书 有 机 会 被 介绍 给 国内 广大 的 读者 而 再 版 ， 
为 充实 本 书 的 内 容 及 效用 ， 我 们 特 加 添 了 新 的 一 章 作为 此 版 的 
第 十 章 ， 

最 后 由 于 北京 大 学 李 患 教授 及 中 国 科技 大 学 冯 克 勤 教授 等 
对 本 书 的 赏识 及 推荐 ， 天 元 基金 的 赞助 及 湖南 教育 出 版 社 孟 实 
华 女 士 再 版 本 书 所 作 的 种 种 努力 ， 使 得 我 们 再 一 次 达成 回馈 区 
国之 愿 ， 容 在 此 致 上 我 们 的 谢 忱 。 
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你 看 过 《数学 传播 ;1984 年 12 月 号 〈32 期 ) 上 第 三 十 四 届 国 
际 科 技 展 数学 得 奖 作品 简介 吗 ? 这 类 展览 都 以 是 否 “ 创 新 ”为 
作品 的 评价 ,而 在 数学 部 门 中 ,在 ¢ 数 学 传播 ?所 介绍 的 八 个 得 奖 
作品 中 ， 就 有 五 个 属于 “数论 ”的 领域 ， 占 了 得 奖 作品 的 一 半 
以 上 ， 为 什么 ?因为 数论 有 它 特别 迷人 的 地 方 一 一 那 就 是 在 极 
简单 的 规则 中 作 极 复杂 的 变化 ， 一 个 类 似 的 例子 是 围棋 。 围 棋 
的 规则 极 简单 而 其 变化 极为 复杂 ,可 以 说 是 最 迷人 的 一 种 棋 类 。 
相反 的 ， 海 陆 空军 棋 其 规则 极 繁 而 变化 又 小 ,几乎 没有 人 下 了 。 
又 研究 整数 论 所 遭遇 的 问题 及 研究 对 象 要 比 其 它 各 门 数学 来 得 
简单 明了 ， 不 外 乎 是 讨论 正 整 数 1，2，3,4… 的 种 种 特殊 性 质 ， 
其 变化 之 大 ， 一 直 困 惑 许 许多 多 的 数学 家 。 

以 往 整 数论 曾 一 直 被 人 认为 是 最 纯 的 纯 数 学 ， 没 想到 由 于 
最 近 美国 有 人 利用 找 一 个 大 数目 的 质数 因子 的 困难 性 及 其 它 质 
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数 的 一 些 特有 性 质 ,而 设计 了 一 种 可 公开 传递 ( 即 不 怕 被 敌 方 截 
获 ) 且 保密 性 极 高 的 密码 ,引起 了 军 方 、 工 商界 的 莫大 兴趣 ， 有 
关 这 方面 研究 经 费 大 为 增加 ， 我 们 在 此 简略 地 说 明 一 下 该 密码 
的 原理 (对 数论 不 熟 的 读者 可 参阅 [1] 或 先 阅 下 章 )。 在 收报 方 
围 先 找 出 两 个 大 的 质数 Pp、4q， 使 m= pg， 及 取 任 一 与 CD) 一 
《p-1)Cq ~1) 互 质 的 整数 4?， 将 此 两 数值 m、a 公 开 传 递 给 发 报 
方 乙 〈 甚 至 登 报 声明 !)， 现 假设 发 报 方 乙 要 将 一 信号 〈 整 数 形 
式 ) 拍 给 甲 。 设 该 代号 为 整数 值 Z( 这 是 保密 的 且 比 p.4 小 很 多 )， 
当然 乙 不 能 运 自 公开 拍 发 x 给 甲 ， 而 公开 拍 明码 Cc 三 2° (mod m) 
给 甲 方 ， 现 甲 方 收 到 明码 整数 c 后 设法 译 回 到 z， 如 何 做 到 此 -一 
译 码 前 工作 呢 ? 因 里 方 有 资料 ?及 9p(ma)，9 为 Euler 函 数 ，pCm) 
表 所 有 小 于 m 且 与 m 互 质 的 正 整 数 的 数目 ,由 假设 a6,pCm) 互 质 ， 
放 有 正副 数 d 及 负 整 数 5 使 得 ad + pCm)b=1, 这 时 甲 方 将 收 到 的 
明码 c 作 变换 ，y= ci《(mod m)， 注 意 取 y 为 小 于 m 的 整数 ,及 由 
于 z 小 于 p 及 q， 故 z 必 与 m 互 质 ， 因 而 由 尤 拉 (Euler) 定 理 我 们 有 
z? 至 1(mod m)， 因 此 
y=0!=(m) r=rl-? (nb 
Xz? Mmod Hi) 三 ZCmod m) 

现 若 两 正 幕 数 z-、y 第 小 于 m 且 模 m 同 余 ， 故 只 有 X=y, 因而 围 方 
就 可 把 密码 收 到 了 。 

欲 解 此 密码 势必 要 知 d， 但 要 知 d 非 要 知 pCm)(=(p-1)。 
(q 一 1)) 也 即 要 知 p 及 4， 找 不 到 pP、g 就 无 法 得 pCm) 及 d, 而 硬 要 
从 c 得 出 x 就 似乎 很 困难 了 ,目前 分 解 一 个 整数 4 的 因子 仍 停留 在 
近似 硬 试 的 阶段 ， 由 后 面 的 “第 法 ”原理 我 们 知道 要 从 2，3，5， 
7,… 一 直 试 到 小 于 v7 的 质数 为 止 ， 由 [1] 中 可 知 若 4 为 ~ 50 位 
数 (p、4 丝 为 25 位 数 )， 则 分 解 4 要 除 10*5 次 ， 以 每 秒 10" 次 的 电 
脑 计算 速度 则 将 是 一 个 101: 年 的 工作 ， 车 用 特殊 的 快速 法 则 来 
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进行 也 得 要 10' 次 的 运算 ， 约 4 个 小 时 电脑 的 计算 时 间 ， 若 # 为 
一 个 100 位 的 整数 , 则 用 目前 最 快速 的 电脑 来 操作 运算 也 得 要 74 
年 左右 (中 间 还 要 保证 机 械 没 故 障 才 行 )， 所 以 目前 用 这 种 方法 
来 传递 需 保密 的 密码 是 相当 安全 的 了 ， 

质数 可 以 说 是 整数 的 基础 ， 由 上 面 的 应 用 我 们 欲 充分 利用 
质数 必须 要 能 建造 很 大 的 质数 ， 要 侦破 上 面 密码 的 应 用 ， 我 们 
也 要 知道 质数 的 分 布 ,本 文 就 是 针对 此 而 需求 作 些 浅显 的 介绍 ， 
希望 能 引起 读者 更 大 的 兴趣 ， 作 更 进一步 的 研究 〈 而 且 可 以 保 
证 的 、 是 任何 这 方面 的 突破 ， 无 论 在 理论 上 与 实用 上 都 会 引起 
强烈 的 反响 )， 光 大 我 们 祖先 的 光辉 ( 因 有 的 密码 是 利用 “中 国 
剩余 定理 ?造成 的 ?。 

具体 地 讲 ， 我 们 主要 将 介绍 的 是 :1. 质 数 及 质数 表 的 制造 
2. 如 何 构造 任何 一 串 列 的 大 质数 ; 3. 质数 在 整数 中 的 分 布 或 密 
度 ; 4. 质 数 的 检验 。 又 本 文 的 介绍 之 参考 书 [1]、[21 尼 是 新 近 
出 版 的 。 


$2 质数 表 ( 秒 法) 及 质数 的 制造 


由 于 质数 是 不 具有 任何 异 于 1 及 其 本 身 的 因子 ， 所 以 早 在 
纪元 前 200 年 左右 十 希腊 学 者 Eratosthenes (以 下 简称 爱 氏 》 就 
为 我 们 发 明 -- 个 可 找 出 所 有 质数 的 法 则 ， 称 为 镁 法 〈Sieve 
method)。 据 说 爱 氏 在 找 质 数 时 ,他 把 整数 一 一 照 序 写 在 一 片 草 
质 的 纸 上 ， 凡 是 非 质数 他 就 用 火 在 那 位 置 毁 一 个 洞 ， 最 后 整 片 
纸 只 留 下 密密麻麻 的 将 多 润 ， 很 像 一 个 第 子 ， 故 叫做 “得 法 ”， 
它 的 原则 如 下 ， 将 正 整 数 由 1 照 大 小 依次 排出 一 列 或 一 矩阵 

〈 如 图 1 是 一 正方 形 拖 阵 ， 其 由 1 至 100 的 整数 组 成 )， 则 头 一 个 
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数 为 1， 为 非 质数 删 掉 ， 其 下 一 个 为 2 为 质数 和 留 下 , 则 2 以 后 删 掉 
所 有 2 的 倍数 (4，6，8，10，12，14，16，18…)， 然 后 在 所 剩 
的 数 中 大 于 2 的 第 一 个 数 3， 其 为 一 质数 ， 继 3 以 后 删 掉 3 的 倍数 
《有 即 6，9，15，21…)，3 之 后 5 为 第 一 个 未 被 删 掉 的 数 其 为 一 
质数 ， 删 掉 所 有 5 的 倍数 (10，…)， 如 此 泡 制 ,所 留 下 的 就 是 所 
有 的 质数 ( 若 只 取 1 至 N 来 第， 则 如 此 所 得 的 是 1 与 N 韶 所 有 的 质 
数 。 在 没有 一 张 质数 表 时 ， 我 们 怎样 确定 一 给 定 的 正 整 数 N 是 
否 为 质数 呢 ? 在 N 很 大 时 若是 以 2 到 N -1 所 有 的 质数 一 一 来 试 除 
和 N 会 是 件 很 耗 时 的 事 的 , 好 在 我 们 只 需 用 2 到 六 间 所 有 的 质数 
来 试 即 可 ， 这 样 一 来 就 省 了 许多 的 除法 。 这 是 因为 车 N 为 非 质 
数 , 则 N=n， x#,% ,及 #: 为 两 个 大 于 1 的 正 整数 , 且 必 有 一 个 数 
G1 或 ?不 大 于 v 克 ， 利 用 此 一 观察 及 得 法 我 们 很 容易 把 所 有 不 
大 于 某 个 正 整数 NGN 不 是 很 大 时 ) 的 质数 找 出 来 。 例 如 我 们 要 
列 出 100 以 下 所 有 的 质数 ， 我 们 只 需 用 小 于 TI100=10 以 下 的 质 
数 2，3，5，7 用 第 法 把 所 有 小 于 100 的 质数 找 出 如 下 ， 

2, 3, 5, 7, 11, 13, 17, 19, 23, 

29，31，37，41，43，47，53，59， 

61，67，71，73，79，83，89，97。 

目前 我 们 有 10 亿 (= 10?) 以 内 的 质数 表 。 而 利用 大 质数 的 
密码 为 了 防止 敌人 利用 电脑 来 俩 破 ， 往 往 是 用 有 50 位 的 质数 ， 
所 以 用 筛 法 来 建造 大 质数 仍 无 法 合 于 实用 。 

又 用 得 法 制造 大 的 质数 时 的 一 个 缺点 是 每 次 要 列 出 或 利用 
许多 的 正 整 数 来 求 得 ， 这 在 实用 上 很 不 方便 。 我 们 很 想 随意 制 
造 一 些 很 大 的 质数 ， 该 如 何 做 呢 ? 最 理想 的 是 我 们 能 找 出 一 个 
公式 或 一 个 式 子 ， 只 要 把 适当 的 数 代入 就 可 得 出 很 大 的 质数 ， 
我 们 中 国人 很 早 有 一 个 有 关 质 数 的 制造 及 拣选 ， 认 为 一 个 正 束 
数 #4 为 质数 的 充 要 充分 及 必要 ) 条 件 是 4 可 整除 2-2， 即 
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fj| (2" ~ 2)， 例 如 4=5，2" -2=30，5130， 这 个 结论 当时 并 汰 正 
式 证 明 ， 而 事实 上 现今 可 证 明 此 条 件 2(2"- 2) 为 必要 的 (这 可 


TT TT TT 
四 加 国名 加 器 加 风 
轩 罗 团 四 国 区 四 加 四 四 
ls [ss [sclss oe 7 salsa lao 
[afl phe lel ehelse 
wlll ese selsn ol 
fva [ve [ee ve [oe or Foe Toa ol 
思 闪 因 办 罗 因 加 加 四 区 
国医 国 罗 机 钠 区 贡 加 机 
四 加 四 区 区 六 | 


图 ! 1 至 100 的 第 法 求 质数 


由 所 谓 的 小 费 马 〈Fermat) 定理 来 证 明 ， 它 是 说 ， 若 a 与 8 为 两 
无 公 因 子 的 正 整 数 , 则 os= oa(Cmod k)， 因 此 为 奇 质数 时 此 条 
件 为 必要 的 立即 可 见 ， 而 当 n=2 时 则 ”12" -2 明显 成 江 )。 但 此 
条 件 却 非 充 分 的 ， 不 过 至 少 以 当时 的 计算 能 力 来 检验 此 一 真实 
性 ,恐怕 也 不 是 件 很 容易 的 工作 ， 因 为 事实 上 对 比 小 于 341 的 正 
整数 n， 若 # 不 是 质数 则 ”|2" ~ 2， 例 如 n=15，2" -2=32766， 
此 数 不 可 能 被 15 整 除 ， 但 = 341(=11x 31) 时 ,用 现代 的 任何 
小 型 电子 计算 机 (Prograimmable Pockct Calculator) 可 得 知 341 
除 3+1 -2 的 剩余 为 0 注意， 对 于 这 样 一 个 具有 101 位 数 的 商 ， 
就 不 是 可 由 此 一 类 机 子 可 算出 了 ， 这 也 难怪 我 们 的 老 祖先 在 只 
有 算盘 代劳 的 劣势 下 ， 更 是 心 有 余 而 力 不 足 了 )，。 

但 很 早 就 有 人 证 明基 有 4n+ 1 形式 的 质数 是 无 穷 多 的 (读者 
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不 妨 试 证 一 下 ! 提示 ， 任 何 一 个 整数 m 都 可 表 成 44，4n 土 1， 
4+ 2 的 形式 中 之 一 )， 又 对 Fo) = 人 +8+41 对 此 一 二 次 式 而 
言 ， 在 ?= 0，1，2，…，40 连 续 41 个 整数 的 值 时 缘 为 质数 ,但 很 
明显 t=41 时 ，f(n) 有 一 因子 为 41， 或 许 有 读者 会 问 可 不 可 能 
找到 一 个 多 项 式 /(7)=aox*+ar! +…+de 系数 Co， ai 
( 丝 为 整数 ) 使 得 对 任何 的 正 蓝 数 4,/(7) 缘 为 质数 ? 这 个 问题 的 
答案 不 难 知 是 否定 的 。 其 证 如 下 : 设 /Cw,)= 了 为 一 质数 ， 则 


对 任何 整数 m,，f(n, + pm) -f(rn)= Sailln + pm)'—#0] 尘 


0Cmod 7)， 又 方程 式 f《no + pm)=0 及 f (no+ pm)= 土 P 至 多 有 
3k 个 整数 解 m， 故 当 m 充 分 大 时 f (no + pm) -f(rmo) 寺 0, 硅 土 p， 
且 为 p 的 倍数 ， 故 为 非 质数 ， 

在 上 面 我 们 证 明了 没有 一 个 多 项 式 Kz)=aoz"+aiz" 十 
… + a, 存 在 使 得 对 所有 的 整数 m，f(m) 永 远 取 质数 值 ， 但 另 一 
方面 我 们 也 不 难 证 明 对 PCz)=6z+ 11, 必 有 无 穷 多 的 质数 pCm) 
《证 明 参 看 [1)) ,在 这 方面 一 个 艰深 的 问题 是 一 个 二 次 或 以 上 的 
束 系 数 多 项 式 ， 即 PCz) = aoz"+ aiz" + 十 Go 82500 寺 0， 
ai=0，1，2，…1) 缘 为 整数 ， 能 否 证 明 {p (mm)7}3-: 必 有 无 穷 
多 个 质数 ? 如 果 读 者 中 有 人 能 解决 此 一 问题 ， 他 的 大 名 一 定 会 
记 在 数学 史上 。 

所 以 我 们 知道 车 要 建造 一 个 函数 /C(x) 使 得 /7 在 :为 正 整 ， 
数 时 ,总 为 质数 , 想 由 多 项 式 的 形式 中 去 寻求 ,是 徒 费 其 劳 的 .下 
面 我 们 就 介绍 密 尔 史 氏 (W, 了 Mills) 的 一 个 建造 法 (1947 年 )， 
其 基本 构想 是 基于 1937 年 英 格 输 氏 CA. E. Ingham) 的 一 定理 ， 
车 把 所有 的 质数 以 大 小 浙 增 地 排列 并 以 序列 p; ,Pp,，…Ps, P+ 1， 
… 或 {ps}?. ,家 之 ， 即 p, 表 示 第 4 个 质数 ， 则 不 等 式 ，pr; :了 ,< 


hp, :成 立 ， 此 处 为 一 定 正 整 数 ,依据 此 定理 密 尔 史 氏 先 证 明了 
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下 面 的 一 个 结果 ， 

引 理 1.1 设 N 为 一 大 于 hs 的 正 整 数 ， 则 N35 与 (N+ 1) ”~1 
之 间 必 有 一 质数 。 

证 明 ， 设 P, 为 小 于 "的 最 大 质数 ， 则 

Nas<p ,< pi+ kp < Ns+RN: 
<Ns+N<CN+1)3 -1 

令 go 为 一 大 于 局 的 质数 ， 则 依据 上 面 的 引 理 ， 我 们 可 找到 

一 无穷 多 的 质数 列 9,，q1，…， 


其 满足 qs<pi,1<<(4q,+1): 一 1 (1) 
令 =4 pn 一 (go+1)3 (2) 

则 由 (C1) 及 (C2) 可 得 
Uy Ui>q: > =, C3) 


及 Un+1 一 (Gu +1)s "< (qt1)3 


=U (4) 
因此 {w ,} 为 一 浙 增 的 数列 ， 且 其 为 有 界 的 ， 因 而 极限 
limu,= A 

四 (5) 
存在 。 
ln ~ A 
[一 一 一 一 一 个 一 ] 
Ul U2 Un 22 vil 
图 2 
接着 密 尔 史 代 证 明了 下 面 的 定理 ， 为 此 先 介 绍 一 个 定义 及 
一 记号 。 | 
定义 1,1 称 一 个 函数 Fz) 为 质数 生成 表示 函数 , 若 对 任何 
正 整 数 #,/(n) 为 质数 。 


LR] 表 示 为 一 不 大 于 RR 的 最 大 整数 ， 例 如 [3.15]=3。 
s 7 。 


定理 1.1 设 4 为 引 理 1 中 所 定 ， 则 /Kz) =[A: ] 为 一 质数 
生成 表示 函数 ， 
证 明 ， 由 式 (3)，(4) 及 (5) 可 得 知 
UU,<A<V, 


或 q<As <q 
因而 依 记号 ”J 的 意义 ， 立 即 得 
[42 ]=9， 

于 是 我 们 证 得 fa = [As ] 皆 为 质数 。 

读 完 上 面 定理 的 结果 ,有 些 读者 或 许 会 看 出 它 的 一 个 缺陷 ， 
就 是 这 个 制造 大 质数 的 函数 是 理论 性 的 一 个 表示 而 已 ， 真 正 的 
值 全 是 无 法 得 出 ， 因 为 我 们 不 知 和 A 到 底 是 多 大 ? 只 知道 它 是 
limw, 的 极限 值 (存在 且 为 有 限 的 ), 所 以 要 制造 大 质数 仍 只 有 靠 
硬 来 的 第 法 了 。 但 有 些 具 特殊 形式 的 数 中 ， 较 容易 得 出 一 些 大 
的 质数 (这 是 下 节 要 谈 及 的 )。 

我 们 知 当 n 充分 大 时 ，#5 与 (n+ 1)? 一 1 两 数 之 间 必 有 一 质 
数 存在 ,和 此 现象 似乎 相 冲 突 的 是 对 任何 给 定 的 大 的 数 ! 我 们 可 
以 建造 一 个 区 间 ， 其 长 变 为 1, 且 在 其 间 无 一 整数 为 质数 。 比 如 
我 们 想 找 一 百 万 个 连续 的 正 整 数 ， 其 皆 为 合 数 ( 非 质数 及 1 的 整 
数 )， 取 49Cn) = C105+1)1+4， 则 当 #==2，3，4,…，1000001 时 
为 合 数 ， 读 者 不 妨 试 一 下 证 明 此 一 般 性 的 结果 ， 由 前 面 所 提 及 
的 英 格 坦 氏 定理 知 一 个 无 质数 的 区 间 的 大 小 与 两 接连 的 质数 间 
隔 大 小 有 关 。 值 得 一 提 的 是 由 它 可 推出 有 名 的 Bertrand 腾 测 ， 
即 在 任何 两 整数 ?及 28 之 间 必 有 一 质数 , 即 

Pi li<2PA 
另 一 有 关 质 数 分 布 的 性 质 是 在 区 间 [*，298] 内 的 质数 数目 ， 和 
[1，#] 间 质数 数目 的 大 小 是 同 级 的 《order)， 此 一 事实 可 由 质 
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数 分 布 的 渐 近 函数 来 说 明 ， 今 以 rCz)? 表 示 小 于 z 的 质数 数量 则 


ZX(Z) ~ Tr 


~ 7 27 
故 元 (27 一 F(2) logr+log2 logx 


_ 2r log2 \*'_ Zz 
= 一 机 Io) logz 


~ 27 -|[ _ log2 |- 了 
iogr logx logz 


2 _ 2zlog2 
logrz logiz 


NX(27) ~— X(T) 
TCD) 


一 >1 (2—> 000) 


$3 质数 的 分 布 


上 节 中 对 质数 间 的 间隔 或 数目 多 少 我 们 用 到 质数 数目 函数 


(2)~ -这 ;一 事实 ,我 们 现 对 质数 此 一 午 要 人 性质 作 一 些 讨论 。 


今 任 一 大 于 1 的 正 整数 在 整个 整数 集 的 分 布 情况 ,如 它 不 是 质数 
就 是 合 数 ， 好 像 没 什么 机 率 可 言 ， 严 格 讲 我 们 将 可 由 质数 数目 
的 渐 近 函数 r(z)， 得 知 对 任 一 正 整 数 其 为 质数 的 概率 为 0， 从 
我 们 熟悉 的 一 事实 开始 ; 正 整 数列 中 每 第 2 个 数 可 被 2 整除 ， 每 
第 3 个 数 可 为 3 整除 等 等 。 如 何 利用 此 简单 明了 的 现象 去 求 得 近 


似 z(z) ~ -ogz 的 结果 ， 是 我 们 在 下 面 要 探讨 的 。 这 儿 的 讨论 
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并 不 严谨 ， 但 却 由 直觉 的 概率 来 说 明 ， 首 先 我 们 要 求 的 是 对 一 
任意 的 正 整数 其 可 被 质数 m 整 除 的 概率 为 1/p， 这 是 因为 由 1 开 
始 每 第 pi 个 数 可 被 p: 整 除 ， 故 一 个 数 可 被 .整除 之 概率 为 1 /pi， 
不 被 pi 整除 之 概率 就 为 1 ~ 1/p;。 我 们 不 妨 视 被 两 个 不 同 质 数 整 
除 是 两 独立 事件 (不 过 对 记 有 的 质数 视 其 皆 为 独立 是 不 可 能 的 ， 
但 可 认为 几乎 是 独立 的 ， 例如 取 一 数 可 被 2 整除 ,不 能 帮助 你 去 
推测 它 是否 能 被 3 整除 )。 则 对 任 一 给 定 的 整数 z 其 不 为 任何 小 
于 其 本 身 的 质数 整除 的 概率 为 


Ox) (1- 访 )(1- 计 )…… 
~ ]] {1-7) (6) 


此 时 的 x 也 都 表示 一 质数 ,但 依据 第 法 的 原则 ， 我 们 只 该 在 上 面 
乘积 的 式 子 中 取 小 于 z 的 质数 pm， 但 由 于 如 此 得 出 的 乘积 在 
分 析 问 题 计算 中 并 没 引 起 多 大 数值 上 的 差别 《rx 很 大 时 )， 所 以 
我 们 可 不 计较 此 改进 了 。 如 果 对 式 (6) 两 边 取 对 数 可 得 


logo(7x) ~ 3 log (1 -二 ) 
pir pi 


这 时 如 果 我 们 同意 依据 log (1+ = 一 纱 + 生 +… 的 展开 式 在 
y 很 小 时 取 logC1+ <! 的 近似 值 代入 式 (6) 中 ， 就 可 得 下 面 在 
z 很 大 时 的 近似 表示 

logoCDs BH (7) 
我 们 仍 想 把 此 一 表示 化 成 一 个 更 具体 而 简 清 的 形式 ,参照 oCz) 
的 定义 及 试想 在 上 面 式 子 (7 ) 中 项 二 ,其 出 现 的 概率 为 9C")。 
此 一 想法 使 得 我 们 可 把 式 (7) 改 写 为 

。 0 。 


Sn) 
logo(z) = 之 本 (8) 
将 此 式 子 表 成 积分 形式 可 得 

logo(z) 之 一 [a (9) 


为 了 去 掉 负 号 作 变 换 4Cx) = -55- 则 由 上 式 可 得 


logA4(z) 之 | dn 


2 nACn) 
”如 果 两 边 取 微分 ， 得 


A’(r) 这 1 
ACx) YACZ) 


(10) 


即 A’Cz) x 二 
因而 形式 上 得 
人 (Z) 久 1og7 
于 是 


@(7T) OT Te (11) 


车 视 此 为 质数 密度 的 平均 值 , 则 对 于 小 于 或 等 于 x 的 质数 数目 函 
数 TCx)， 就 可 用 下 面 的 近似 式 来 表示 了 ， 


~ (dr _ zx 
TT) | logz ”Togr 


§4 有关 质数 检验 的 一 些 结 果 


要 检验 一 个 给 定 的 正 整数 4 是 否 为 质数 ,得 法 是 最 直接 的 一 


es 了 1 。 


法 子 , 但 它 要 用 所 有 小 于 * 的 质数 来 试 除 (大 约 有 2 nn /log 
个 质数 )， 这 对 大 的 %?， 即 使 用 电脑 来 计算 也 不 切实 际 ， 我 们 知 
道 要 建造 大 的 质数 也 不 是 件 容易 的 事 ， 但 总 有 些 有 耐心 及 聪明 
的 人 在 那 探 求 找 大 质数 ， 以 下 我 们 就 介绍 一 些 有 关 的 尝试 。 
和 费 马 〈Fermat， 提 出 有 名 的 费 马 猜想 的 ) 及 笛 卡 儿 
(Descates) 为 朋友 的 法 人 墨 森 尼 (Mersenne) 曾 列 了 一 个 具有 形 
式 M,=2 -1， 但 为 质数 的 一 个 表 ，M, 就 称 为 黑 森 尼 数 。 很 明 
显 , 若 ? 为 合成 数 ， 则 M, 不 可 能 为 质数 ,所 以 内 有 ?为 质数 时 ，M。 
才 可 能 为 质数 ， 已 知 的 黑 森 尼 质 数 有 
M,=2:-1=3, Ms=2:~1=7, 
Ms=25~1=31, Mi;~=2’7~1=127, 
Ms=2—1=8191, Mi;=2!'7 -1=131071， 
Mis=2:1—1=524287, My1=2!:—1=2147483647。 
M1 为 质数 此 一 事实 是 在 1750 年 为 尤 拉 所 证 明 ， 且 为 1876 年 前 
所 知 的 最 大 质数 ， 而 M11=2:! 一 1=2047=23X89, M,6=29 
-1=536870911=233x 1103 x 2089, 所 以 不 是 对 所 有 的 质数 p， 
M, 亦 为 质数 。 在 1876 年 鲁 克 斯 (E, Lucas) 发 现 了 一 个 法 则 间接 
地 证 明 一 个 M, 数 是 否 为 质数 , 他 主要 应 用 了 以 M, 为 模 的 整数 环 
Cring)， 在 此 环 中 两 个 数 的 加 减 乘 和 往常 一 样 ， 只 是 车 结 果 的 
值 不 在 0 到 M, ~ 1 的 范围 内 时 ,以 用 M, 除 该 数 记 得 的 为 非 负 的 剩 
余 ! 例如 以 Ms 为 模 的 整数 环 中 ，5x 7 三 3Cmod Ms) 的 一 些 基 
本 性 质 。 他 的 结果 被 近代 的 赖 莫 尔 氏 (D. 也 Lehmer7 精 简 为 下 
面 的 法 则 ， 
车 Pp 为 大 于 2 的 质数 ， 定 义 L1， 工 。,…' 如 下 ， 
工 二 4， 及 对 nn 宇 2 
L,=L’:.,~2(mod M,) 
则 M, 为 质数 当 且 仅 当 
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了 ,=0 (mod M,) 

我 们 看 如 何 用 上 面 法 则 来 检验 Mi:=2! -1=2047 是 否 为 质 
数 ? 因 L,=4,L,=14,Ls=194,L,=788, Ls=701,Le=119, 
LL 二 1877，L,s=240， LIL, 二 282,， 及 Li,0=1736， 于 是 工 10 于 0 
《mod 2047)， 因 而 M, :不 可 能 为 质数 。 

在 同年 (1876) 鲁 克 斯 用 上 法 检验 M,:y7， 他 计算 了 ZL ， 工 :， 
…， 工 sse， 发 现 了 Mi:=0 (mod M,,;)， 因 而 创下 了 打破 保 
持 了 75 年 Ms :为 最 大 质数 的 纪录 ， 自 从 1950 年 开始 进入 电脑 的 
时 代 后 ， 利 用 鲁 克 斯 法 则 及 二 进位 的 计算 原理 ， 很 多 很 大 的 质 
数 陆续 被 得 出 。 例如 1952 年 证 明了 有 687 位 数 的 Ms:s :为 质数 ， 
1971 年 证 明 M,。。 s+ 为 质数 其 有 6002 位 数 , 在 1978 年 由 两 位 18 岁 
加 州 州 立 大 学 的 学 生 共同 证 得 具 6533 位 的 M,1;01 为 质数 ,最近 
1983 年 有 人 证 得 具 39751 位 数 的 M1, ,4,4 为 质数 (在 证 明 此 一 事 
实 中 ， 曾 利用 Ms:。es + 1 为 2 的 宕 次 )， 如果 读者 中 有 人 想 在 数 
论 中 留 一 席 之 位 ， 不 妨 试 试 找 出 一 个 比 此 数 更 大 的 质数 ， 这 可 
能 相当 的 困难 。 有 关 和 鲁 克 斯 法 则 的 证 明 及 应 用 ， 我 们 在 下 章 还 
会 谈 到 。 

在 [1] 中 也 提 到 一 个 有 趣 的 事实 ， 即 m 若 不 是 质数 , 则 至 少 
有 一 半 以 上 的 数 从 2，3，… 到 六 ~ 1 不 能 满足 se" :三 1Cmod m)， 
这 点 说 明 若 1 为 质数 ， 则 从 2，3，…' 开 ~ 工 任 下 一 数 c， 使 得 


o" :==1Cmod m) 成 立 的 机 会 相当 大 (至 少 是 郊 ), 但 至 今 仍 无 一 


简便 的 法 则 找 出 一 个 与 m 互 质 的 a, 这 是 读者 可 以 动手 动脑 试 一 
试 的 问题 。 
我 们 提供 下 面 有 关 质 数 的 一 有 趣 性 质 ， 作 为 本 文 之 结束 。 
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§5 证 明 ， 5 
( 即 所 有 质数 级 数 之 和 为 发 艇 的 ) 


所 有 正 束 数 之 和 :， 1+2+… … 显 然 是 无 穷 大 的 ( 即 为 
一 发 散 级 数 )， 但 如 问 记 有 正 整 数 之 倒数 形式 之 级 数 瑟 十 是否 


为 发 散 ? 解答 此 问题 只 要 稍 用 些 技巧 就 可 达到 ， 但 如 可 利用 级 
数 与 积分 之 关系 ， 则 也 很 容易 证 明 此 级 数 为 发 散 的 ， 同 样 的 问 
题 对 所 有 的 质数 〈 读 者 首先 证 明 此 集合 为 一 无 穷 集 的 事实 1)， 
我 们 也 有 下 面 类 似 的 结果 ， 但 它 的 证 明 就 难得 多 了 。 它 的 证 明 
也 有 几 种 ， 但 我 们 介绍 的 是 一 很 初等 的 证 明 。 

定理 1,2 ” 设 p;,，p:，…p,，… 为 所 有 质数 且 照 递增 秩序 排 


列 的 数列 ， 则 级 数 9 = 已 - 工 为 发 散 的 ， 即 @ 的 信 为 无 穷 大 。 


证 明 ， 我 们 将 用 反 证 法 ， 即 设 8 为 一 收敛 的 级 数 并 试 由 此 
导出 矛盾 。 今 假设 & 收 敛 于 一 有 限 正 数 s， 则 由 收敛 值 的 定义 ， 
我 们 可 找到 一 个 整数 A， 使 得 Q@ 的 R- 1 项 部 分 和 


1 1 
Qi1= >- <5 ~ 
: 之 了 2 : 


1 1 

二 _ 十 一 -一 一 一 

而 Q;=Q-1 Bs 2 
s-L 

Qi 9 Q2, : 人 9- 


站 一 一 
0 5 
留 3 


(此 处 -的 选择 并 无 特别 的 意义 ， 任 何 一 个 小 的 正 数量 都 可 ) 
于 是 有 


pp=0O-0= -+ + (12) 


就 此 &， 我 们 对 任何 一 正 整 数 z， 定 义 N CR，z) 为 所 有 不 大 于 > 
的 正 整 数 ， 其 不 被 任何 大 于 及 的 质数 整 踪 者 的 集合 ， 我 们 以 
NGC，z)| 表 集合 N(R，zr) 中 元 素 的 数目 ， 例 如 =4， 则 所 有 
大 于 p, 的 质数 集 ={ps，pe，Dp，…}={11，13，17，19，…】} 
= 了 T,。 于 是 NC4，10)={1，2，3，…，10}, 故 |NC4,10)| =10， 
而 NC4，15)={1，2，3，4，5，6，7，8，9，10,，12，14，,15} 
共 13 个 元 素 ( 这 是 因为 由 1 到 15 中 除了 11、13 外 没有 一 个 正 整数 
可 能 具有 集合 T, 中 任 一 元 素 为 因 于 者 ).， 

今 对 任 一 正 整 数 > ， 我 们 都 可 先 将 它 表 成 质 因子 的 需 次 的 
乘积 ， 

之 一 了 1 了 Dr 
其 中 a1，Qs。，…，0; 为 整数 , 若 将 所 有 具 偶 数 寡 次 的 项 与 将 奇数 
短 次 减 1 的 项 的 乘积 以 w: 表 之 ， 其 余 项 的 乘积 以 v 表 之 ， 则 
2 一 WU 

其 中 w、" 缘 为 整数 ,o 中 的 质 因子 的 客 次 皆 为 1, 如 z 一 27345"7"， 
则 z=(24345274),(2x7)=(23.32。5.7)2(2x7)。 现 在 我 们 看 
什么 样 的 正 整数 y 可 能 属于 NCA,z)， 很 显然 它们 必须 满足 ， 

(1) 7 委 7。 

(2) 所 有 ! 的 质 因子 必 来 自 {pD:,p:，…，*pej 中 ， 

依据 上 面 两 个 条 件 ， 我 们 先 来 估计 一 下 |NC&, x)1 的 大 小 。 
由 于 对 任何 VE NCR，7)， 则 有 y= 二 WV? 及 Vv 之 1， 

故 Ww z 
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而 因 v 的 因子 来 自 {P1，Pi，…sD4s} 且 皆 为 1 次 矫 ， 故 所 有 可 能 为 
v 的 数 至 多 有 2* 个 ， 综 合 以 上 的 分 析 , 我 们 得 知 在 符合 条 件 (1) ， 
(2) 下 ， 至 多 有 
[FIX 2 个 y 
(其 中 [a] 表 不 大 于 a 的 最 大 整数 ) 
可 能 属于 NC(&，x)， 于 是 
INCk, x7) < 委 20 7 (12) 


故 对 于 任 一 正 整 数 x 由 1 到 z 的 正 整数 中 ， 其 中 INC&k,x)| 不 可 能 
被 Da: 1 ;Pris，… 中 任 一 个 数 整 除 , 剩 下 的 共有 ZX ~ |N(R,X)| 个 ， 
每 个 数 都 可 能 具有 ps;1，Pi; 2， … 中 某 些 数 为 因子 。 现 从 另 一 
角度 来 估计 x ~ |NCk, x)| 的 大 小 ， 在 {1，2,…，z 一 1，7z} 中 很 
明显 至 多 有 7X/ps; i 个 数 可 被 Di, ;整除 ，z/ps; :个 数 可 被 py: 整 
除 ，… 等 等 。 所 以 由 此 及 (12) 可 得 


x- 1NCR，z)| < 2 -了 + 
Phk+1l DR+2 


1 
< 有 +1 " 元 + 


Tr 
< 
因而 


[INCk, x)| > 了 (14) 
于 是 由 (13)、(14) 两 式 得 
F<INGk, 17) | <2 了 (15) 


并 注意 此 不 等 式 的 导 至 与 x 的 大 小 无 关 ， 特 别 取 7 三 2*"** 时 ， 
由 (15) 将 得 不 等 式 ， 


» T6 。 


22"+1<|NCR， 22"+2)| < unti 


此 为 不 可 能 。 此 一 矛盾 亦 证 明了 Q = 习 于 必须 为 发 他 才 行 。 


研究 问题 ， 如 果 我 们 限制 质数 的 形式 结果 如 何 呢 ? 此 似乎 
是 个 新 的 问题 ,具体 的 我 们 可 以 问 ， 设 {pi} 为 具 44+ 1 形式 的 所 


有 质数 序列 ， 则 袜 -是 发 散 抑 或 为 收 全 ? 
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第 二 章 ”数论 在 密码 上 的 应 用 


81 前 


路 


数论 ， 顾 名 思 义 ， 是 一 门 研究 数学 性 质 的 学 问 ， 一 般 所 谓 
的 数论 ， 特 指正 整数 〈 即 自然 数 ) 的 许多 性 质 , 像 质数 的 分 布 、 
方程 式 的 正 整数 解 、 韩 信 点 兵 及 进位 法 都 包括 在 数论 里 面 。 我 
们 在 小 学 时 候 学 的 分 解 因数 、 最 大 公约 数 也 是 数论 的 一 部 分 ， 
可 异 因 为 数论 在 日 常生 活 中 没有 什么 直接 的 用 处 ， 在 中 学 数学 
里 很 少 提 到 数论 ， 一 般 被 认为 是 一 种 “ 纯 数学 ” , 深 而 元 用 。 可 
是 “无 用 之 用 , 真 乃 大 用 ”, 终 于 在 20 世 纪 70 年 代 后 期 ， 几 个 电机 
工程 师 用 数论 的 一 些 基本 定理 ， 制 成 了 一 种 新 的 密码 这 种 由 
数论 所 作成 的 密码 与 以 前 人 们 所 用 的 密码 ， 有 着 根本 性 质 的 不 
同 ， 可 说 是 密码 史上 一 个 空前 的 革新 ， 

密码 通讯 在 军事 上 的 用 途 是 大 家 都 知道 的 ， 但 由 于 交通 的 
发 达 , 在 分 秒 必 争 的 工商 业 社 会 里 ,商业 上 的 情报 也 已 成 为 商业 
至 余 的 主要 依靠, 比如 说 ,有 人 早 儿 个 小 时 知道 什么 公司 有 了 一 
种 新 的 发 明 ， 或 某 两 个 公司 计划 合作 ， 或 某 地 区 有 物价 的 大 波 
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动 ， 就 可 以 在 股票 上 的 波动 做 文章 , 转 肛 之 问 收 进 大 笔 的 财富 。 
内 此 公司 本 身 内 部 及 公司 与 公司 之 间 的 通讯 都 希望 能 对 外 严守 
机 密 ,. 但 由 于 现在 通讯 无 论 是 有 线 或 无 线 都 很 容易 被 敌 方 窃听 ， 
因此 公司 必须 对 情报 加 锁 ， 即 所 谓 密码 通讯 。 

以 往 人 们 在 军事 上 所 用 的 密码 其 基本 的 形式 在 于 “ 代 换 ” 
与 “置换 ”比如 说 ， 我 要 发 出 下 面 一 个 消息 给 你 ， 

“我 有 一 个 秘密 对 你 说 ” 

我 就 先 把 这 几 个 字 换 成 数字 ， 即 一 般 电 码 本 .上 的 代码 ， 假 
定 “ 我 ” 字 的 代码 是 3314， “有” 字 的 代码 是 1432，“ 一 ” 字 
代码 是 0001 等 等 ， 则 上 面 那 句 话 就 成 了 

331414320001.… 
代 换 密码 是 把 0，1，2，…，9 十 个 数字 互 换 ， 比 如 我 们 可 以 把 
0 换 成 2 ，1 换 成 3， 等 等 ， 若 用 群 论 的 符号 表示 ， 上 面 的 代 
换 可 写成 
0123456789 
G- (ss357649081) 
这 个 表示 法 是 上 行为 0，1，2，…，9， 而 下 行 是 他 们 代 换 成 的 
新 数字 ， 即 0 一 2，1 一 3，2 一 5，…。 因 此 刚才 的 电码 若 用 G 法 
代 换 ， 则 成 了 
773636752223.… 

这 时 一 个 不 知道 这 个 代 换 规则 的 人 看 到 了 上 面 的 信号 ， 他 就 不 
能 从 电码 本 子 里 找 出 它 的 原意 了 。 置 换 法 在 于 把 密码 排 成 一 种 
双方 都 知道 的 形式 ， 如 下 图 


国生 
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则 发 出 的 信和 号 为 755772433216623。 同 样 地 ,不 知道 这 种 特定 图 
案 的 人 ， 很 难 解 开 原 来 的 信息 。 

以 代 换 法 为 例 ， 像 G 这 类 的 传 换 可 以 有 101 一 3628800 种 不 
辐 的 变化 ， 假 定 我 们 可 以 在 一 分 钟 内 试 一 种 代 换 ， 又 假定 我 们 
的 运气 中 等 ， 在 试 到 一 半 时 即 101/2= 1814400 时 可 以 成 功 ， 则 
在 不 吃 、 不 睡 、 不 错 的 情形 下 ， 我 们 要 试 3 年 零 165 天 ,等 迷 解 
出 来 的 时 候 ， 仗 早已 打 完 了 。 但 这 只 是 最 基本 的 密码 而 已 ， 在 
生死 关头 ， 更 难 解 的 密码 必然 出 笔 ， 例 如 在 代 换 法 中 ， 若 两 位 
两 位 的 代 换 〈 即 00~>79，01->85,…) 则 其 变化 可 达 100! = 9.32 
x 105? 种 之 多 ， 如 果 我 们 再 用 硬 试 的 方法 ， 则 一 百 万 人 同心 协 
力也 得 用 6 x10: 年 才能 试 出 谜底 ， 可 是 地 球 的 年 龄 不 过 只 有 
5 x 10" 年 而 已 。 

因此 解密 码 ， 都 不 用 硬 试 的 方法 去 解 。 一 般 可 用 统计 的 方 
法 ， 根 据 名 字 〈 或 字母 ) 出 现 的 频率 及 发 生 的 事件 加 以 分 析 ， 
例如 在 英语 中 ， 各 字母 出 现 的 频率 按 多 少 排列 是 

e, a, 0, i, d, h, n, r, §, t, 
u, >, Cc, f, 8 Tl, m, ww, b, 

因此 一 个 出 现 次 数 最 多 的 符号 就 很 可 能 代表 e， 出 现 次 多 的 符 
号 就 很 可 能 代表 e， 并 以 此 类 准 . 但 道 高 一 尺 ， 麻 高 一 丈 ， 如 果 
不 断 地 变化 代 换 的 方法 ， 比 如 说 前 一 百 个 字 用 代 换 法 G,， 第 二 
个 一 百 个 字 用 代 换 法 G:， 则 频率 方法 亦 失 去 功效 。 但 是 魔 高 一 
下 恶魔 更 高 一 丈 ， 重 赏 之 下 ， 天 下 尚 没有 绝对 解 不 开 的 密码 。 
二 次 大 战 时 ,美国 密码 兼 统计 学 家 弗 立 得 门 (W. PR. Friedman)， 
在 一 年 半 的 时 间 完 全 破获 了 日 军 的 密码 。 在 中 途 岛 一 战 ， 美 国 
海军 以 劣势 的 军力 ， 大 胜 有 目 本 皇家 海军 〈 读 过 参加 该 战役 的 日 
本 军官 渊 田 美 津 雄 及 奥 宫 正 武 所 著 的 “中 途 岛 ” 一 书 吗 ?)。 另 
外 英国 也 几乎 在 同时 解 开 了 德军 的 密码 ， 做 到 了 知己 知 彼 的 优 
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势 地 位 〈 知 已 知 彼 并 不 一 定 百 战 百胜 ， 但 总 比 不 知 彼 要 好 得 
多 ). 

过 去 这 类 密码 的 特质 (也 可 以 说 是 缺点 ) 在 于 它们 是 关闭 
式 的 制 解法 ， 即 收发 双方 都 必须 同时 知道 这 种 密码 的 构造 ， 因 
此 如 果 在 一 通讯 系统 中 有 一 个 联络 站 被 间谍 渗入 或 被 敌人 占 
领 ， 则 密码 的 机 密 可 能 全 盘 暴 露 。 而 现在 用 数论 的 密码 却 是 公 
开 式 的 (Public-Key Cryptography)， 即 是 只 有 收 方 知道 密码 
的 解法 ， 发 方 只 需要 知道 艇 法 而 已 ， 而 且 这 种 制 法 可 以 公开 . 
因此 即使 发 方 被 捕 ， 敌 人 仍 榨 不 出 解密 码 的 机 密 来 ， 其 程序 是 
这 样 的 

1. 收 方 先 告诉 发 方 如 何 去 把 情报 做 成 密码 《敌人 也 听 到 了 
这 个 做 法 )。 

2. 发 方 依法 发 出 情报 的 密码 敌人 也 听 到 了 这 个 信号 )， 

3. 收 方 解 开 此 密码 为 原 信息 《但 敌人 却 解 不 开 此 密码 )。 

当然 把 收发 互 换 ， 就 可 以 互通 信息 了 。 刚 才 说 过 这 种 方法 
最 大 的 好 处 就 是 只 有 一 方 知道 解码 的 秘诀， 比 以 前 收发 双方 都 
知道 秘诀 的 保密 性 高 多 了 ， 自 从 这 类 的 密码 法 发 表 之 后 ， 在 美 
国 军事 界 、 教 育 界 、 工 商业 界 引起 了 一 个 轩然大波 。 对 大 多 数 
的 数论 家 而 言 则 是 一 则 以 喜 ， 一 则 以 惧 。 喜 的 是 ， 皇 天 不 负 茧 
心 人 ， 一 向 不 容易 找到 饭 吃 的 数论 家 突然 成 为 许多 经 费 充裕 的 
军工 商界 所 争取 的 对 象 。 费 马 、 尤 拉 以 及 那些 一 生 穷 困 而 已 作 
吉 了 的 数论 家 可 以 含笑 九泉 了 。 但 惧 的 是 ， 由 于 这 些 理论 在 军 
事 通 讯 上 的 价值 ， 有 关 这 方面 的 新 发 现 已 被 视 为 国防 机 密 而 列 
为 管制 了 。 以 往 各 国 数论 家 无 忧 无 虑 发 表 论文 自由 交换 意见 的 
日 子 也 许 是 一 去 不 返 了 ， 前 程 固然 似 锦 ， 往 事 却 已 如 烟 ， 纯 数 
学 最 后 一 块 净土 也 终于 被 实用 所 “污染 ”了 。 然 而 这 次 因 密 码 
而 推动 大 家 对 数论 的 研究 ， 将 在 数学 史上 写 下 有 趣 的 一 页 ， 
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这 种 密码 所 用 的 数论 并 不 深 ， 我 们 可 以 全 部 介绍 出 来 ， 当 
然 在 实际 用 的 时 候 ， 数 学 会 大 得 多 ， 但 在 大 小 型 电子 计算 机 如 
此 普遍 的 今日 ， 是 不 会 成 问题 的 ， | 

在 我 们 介绍 两 种 主要 的 数论 密码 之 前 ， 我 们 先 将 介绍 一 点 
数论 。 


8 2 因子 、 质 数 、 同 余数 与 费 马 尤 拉 定 理 


若 m、n 为 两 整数 ， 且 m>>0， 则 以 m 陈 n 可 得 两 个 整数 d 与 7， 
使 得 
n=dm+r (0<r<m) 
其 中 d 称 为 不 完全 商 ,，r! 称 为 余数 。 著 r =0， 则 我 们 说 x 可 被 mm 所 
整除 ,mm 为 mn 之 因子 ,mn 为 mm 之 倍数 , 若 一 数 除 1 与 本 身 之 外 无 其 他 
因子 ， 则 此 数 称 为 质数 ， 例 如 2 ，3 ，5，7，11 都 是 质数 ， 
4 ，6 ，9,12 却 不 是 质数 ， 我 们 定义 7 与 对 有 同 余数 ， 
ns (mod m) 
是 指 如 果 n 与 ;被 m 除 时 有 相同 的 余数 。 例 如 
12=2 (mod 10) 
8=5 (mod 3) 
有 一 个 关于 同 余 式 的 简单 定理 ， 我 们 把 它们 列 出 来 ， 读 者 很 容 
易 证 出 来 ， 
定理 2.1 若 p=4 (mod m) 
a=b (mod m) 
则 cp 三 ba (mod m) 
车 两 正 整数 p、4 的 最 大 公 因 子 ( 约 数 ) 是 1， 则 我 们 称 P、4 
互 质 ， 以 
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(p, q)=1 
表示 之 。 现 在 我 们 要 证 一 个 有 关 两 个 互 质数 的 一 个 基本 定理 。 
定理 ?2.2 ”车 两 正 整数 p、4 互 质 ， 则 可 以 找到 二 整数 (不 一 
定 正 ) ce、b， 使 得 
apDp+pq= 1 
证 明 ， 令 4 为 含 所 有 * =ap+bq> 0，a、b 为 整数 之 集合 ， 
此 集合 显然 不 是 空 集合 ， 因 可 取 a=b= 1 ,P+4>> 0。 令 d 为 此 
集合 中 之 最 小 者 ， 若 &= 1 ， 则 本 定理 得 证 ， 若 4d> 1 ， 令 ap+ 
bq=d> 1， 则 任 取 此 集中 之 另 一 数 a P+5'4， 则 我 们 车 以 d 除 
a’p+b’g 有 
a’p+b’q=ad+r 0<r<d 
代入 d=ap+ bq 
则 得 
(a’~aa)p+(b’~ab)gq=r 
此 r 必 为 6， 否则 7 为 4 集中 一 小 于 d 之 数 ， 与 假设 d 为 最 小 数 相 
矛 质 ， 因 "= 0 故 d 为 4 集中 任何 一 数 之 因子 。 因 
p€A (a=1, b= 0) 
q€A (a=0, b=1) 
故 d 为 P、4 之 公 因子 ,但 ?7、4 之 最 大 公 因子 为 1, 故 d = 1 。 定 理 
这 是 一 个 极 有 用 的 定理 ， 读 者 也 许 要 问 ， 我 们 如 何 找 到 a 
与 了 使 ap +b4=1 呢 ? 一 般 可 用 驾 转 相 除法 。 
例 ， 找 整数 a 、5 ， 使 得 5a+ 99= 1。 因 
9=5+4, 5=4+1 
故 1=5-4=5-(9- 5) 
=2x5-9x1l 
故 a=2, b=~1 
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推论 2.1 车 Ww 与 m 为 二 互 质 的 正 整 数 且 m>>w, 则 可 找到 一 
正 整 数 9 使 得 


wo=1 (mod m) 


证 明 ， 由 定理 知 ， 有 a .0 二 整数 使 得 ow + bm=1， 因 bm 
为 m 之 倍数 ， 故 
aw=1(mod m) 
令 a=gm+90 0<06<m 
则 得 6%w=1 (mod m) 且 9090 
关 6 不 可 能 为 0， 故 本 推论 得 证 
最 后 我 们 要 用 到 一 个 不 容易 证 明 的 “ 费 马 、 尤 拉 (Fermat 
-Euler) 定 理 ”"”。 但 因为 我 们 只 用 到 这 个 定理 比较 容易 证 明 的 特 
殊 形式 ， 我 们 就 只 证 明 简单 的 部 分 。 
定理 2.3 车 mm 为 质数 ，w 为 任 一 与 m 互 质 的 整数 ， 则 
w"-i=1(mod m) : 
证 明 ， 先 把 w 写 成 w 个 1 的 和 ， 则 由 多 项 式 定理 知 
C1+1+1+.+1)" 
的 展开 式 中 除 w 个 1 之 外 ， 都 含有 的 因子 Gm 为 质数 ， 


此 


my m! < 、 
ml! =Cn=77 Cm-7517 中 之 "不 可 能 消去 )， 故 


w=wmod m) 
两 边 乘 以 推论 1 中 的 6， 即 
bw 三 1(aod m) 
得 Ww"-!==1 (mod m) 
本 定理 证 毕 ， 
推论 2.2 车 m 为 两 质数 p、4 之 积 ，w 为 任 一 与 mh〈 即 同时 
与 5 与 9) 互 质 之 整数 ， 则 
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WolD=1T (mod m) 
证 明 ， 先 用 定理 2.3 之 证 明 法 得 
wr !=1 (mod p) 
WwW 1 三 1 (mod 4) 
由 定理 2.1 可 得 
(we DT (mod p) 
同 理 可 得 
(Cw? PT (mod 9) 
由 上 面 两 式 及 p、4 互 质 ， 不 难得 到 


will (mod pq) 
即 we-i) (Da=1 (mod m) 
本 推论 证 毕 、 


我 们 还 要 利用 到 另 一 个 简单 的 定理 ， 我 们 也 在 这 节 里 把 它 
定理 2.4 令 (a1，0。，…，04) 为 一 含 h 个 正 整 数 的 数列 ， 


‘0 之 1 

,Qs >al 
‘as>al+a, 
; 


| QiQ) 十 区 十 “Tl 


GaG + 二 十 (1 


又 令 (2X1, To To) 为 一 由 0 与 1 组 成 的 数列 , 则 所有 
然 2i 不 是 0 就 是 1， 现 设 c ，c:，…，g 为 已 知 ，X1 32， …， 
Zz, 为 来 敌 ，C 为 一 正 整 数 ， 则 方程 式 
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c 一 》 aizi (2.2) 
i=1 


只 有 一 解 或 无 解 。 
证 明 . 设 此 方程 式 有 二 人 解 (X1， ZI 及 (7X1, Xss 
…，ZX 人)， 则 消去 c 之 后 可 得 


并 ee 0 
因 lz:-xi|<1 
故 IZ Ga |< Dao 
由 此 推 得 z-z*=0 
且 -zy =0 
同 再 可 得 
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此 两 解 原 为 一 ， 本 定理 得 证 ， 

而 要 解 (2.2〉 是 非常 容易 的 事 ， 因 为 若 
C >artas+" tO 

则 z, 必 为 1， 和 否则 必 为 0， 同 理 若 
[#3 — TAdn> a 十 Ga 二 十 0 


则 z，; 必 为 1， 否 则 必 为 0， 以 此 类 推 ， 一 下 子 就 解 出 来 


这 几 个 定理 就 足够 解 新 的 密码 法 了 。 
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$3 狄 飞 、 赫 尔 曼 、 考 克 儿 
(Diffie-Hellman、Merkle) 法 


此 法 是 由 上 列 三 位 电机 工程 师 兼 数学 家 〈 科 学 本 是 一 家 ， 
触 类 旁 通 ， 称 他 们 是 什么 家 并 不 正确 ， 也 不 重要 )， 在 1976 及 
1978 年 所 发 表 的 方法 。 在 此 方法 中 ， 所 有 的 信号 必须 写成 二 进 
位 数 的 形式 ， 假 如 前 面 的 “我 ” 字 代码 3314， 若 以 二 进位 表示 
风 为 2!!5+2!0+0.28+0.28 二 27+28 十 25 十 24 二 0.23 十 0.22 十 
2.+0.2"， 则 

110011110010 
我 们 将 任何 一 位 信号 分 成 许多 跋 ,每 段 含 个 0 与 1 的 数 ， 即 (zi， 
T2y rp 以 下 是 本 密码 法 的 收发 程序 (参看 图 5)。 
政 报 方 (秘密 作业 ) 公开 通讯 发 溉 方 (秘密 作业 ) 


1,. 取 一 组 {a Q7 
an), 及 一 正 数 w， 

n 
一 质数 mw a; 今 

1 


ai 一 im (modm) 


2. 发 出 (ai0 ,a 
an0) 


4， 由 c0 解 出 (xi »X2, 


ss Xn) 


者 5 在 此 种 操作 中 ， 政 方 仅 知 《010，…，8.0) 及 c%， 而 发 方 除了 自己 的 信号 外 
并 不 比 敌 方 多 知道 什么 密码 的 机 密 ; 只 有 发 方 完全 掌握 了 解码 的 方法 ， 
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] .由 收报 者 秘密 的 取 一 组 满足 定理 2.4 的 正 整 数列 (al ;qz， 
… 0,) 及 任 一 大 于 >a 的 质数 m， 及 男 一 数 w， 令 


0 三 QiWwW(nod m) 
2.《 公 开 ) 发 出 《41 ，42"，。…，4,") 给 发 报 者 《 敌 方 可 以 
知道 )。 
3. 发 报 者 用 4a: "，as”，…，4a,' 与 要 发 的 0。1 信 号 *1，7s， 
0, 求 出 


n 
C= ras 
t=1 


并 将 c" 之 值 告诉 发 报 者 〈 敢 方 可 以 知道 c")。 

4. 收 报 者 收 到 c" 之 后 ， 可 以 解 出 原 信 号 zi， za，…，2w( 而 
敌 方 却 不 容易 用 已 知 的 91"，a2"，…，0," 及 c" 解 出 信号 , 原因 
马上 会 谈 到 )， 

我 们 先 看 收 方 如 何 解 出 x;,， 由 推论 1 可 知 存 在 -9>>0 且 w0 
三 1(mod m)， 车 将 收 到 之 信号 方程 式 两 边 乘 以 9 可 使 

CI=TAI+ToaT + e+ Ta (3.1) 

变 成 

c'0=7riarO tr a0+ +r,a,"0 (3.2) 
但 a'0=aw0=a,(mod m) 
故 令 

c'0=c(mod m) 
(3.2) 即 成 为 


CErA + Td tt Ld, (mod m) 
因 m> ja, 上 式 与 (=XiQ1 X20 十 十 Zs4s 相 同 ， 根 据 定 
i1=1 
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理 2.4 之 说 明 ， 一 下 子 就 可 以 解 出 z:，za，…， Zn 可 是 敌 方 在 
整个 的 过 程 中 知道 (3.1) 之 关系 , 因 a;' 并 不 见得 是 一 个 有 a: 那 样 
规则 的 数列 ， 到 目前 为 止 只 有 硬 试 一 条 途径 ， 即 
(Zi TD) 一 (1，0，0，…，0)， (C0, 1, 0 De 
等 一 个 一 个 地 试 ， 对 小 的 x 并 不 难 ， 但 对 大 的 x 而 言 ， 比如 说 ” 
二 1000 (这 并 不 是 一 个 很 长 的 信 号 )， 则 平均 要 试 2'""" 7 
二 10"! 次 才 可 以 解 开 ， 这 是 一 个 天 文 数字 ,车 电脑 在 一 秒 钟 内 
可 以 做 一 百 万 次 检验 (目前 尚 办 不 到 ), 则 一 年 只 可 以 做 3.15 x 
1013 次 检验 ， 那 么 要 解 开 (3.1) 需要 10: 年， 前 面谈 过 地 球 
的 年 龄 不 过 5 x 10?* 年 而 已 ， 我 们 且 举 一 个 简单 的 例子 。 
例 ， 今 18=5， (al,， 4, ds, as。 45) 
=(]1], 3, 6, 12, 25) 
WwW=13, m=51 
则 收 方 发 出 的 密码 法 (a?，a?，a3，42，4;》 分 别 为 
a’ 三 13xX1=13 (mod 51) 
a'=13x 3=39 (mod 51) 
as13x6=27 (mod 51) 
qi 三 13x123 (mod 51) 
a 三 13x25=19 (mod 51) 
这 即 是 发 报 者 收 到 的 作 密码 的 a*， 假 定 发 方 所 要 发 的 情报 是 
10101， 则 因 
C? 一 13+27+19=59 
故 收 方 所 收 到 的 密码 是 59， 要 解 开 此 码 ， 收 方 先 得 找到 9 使 9W 
三 1 (mod 51)。 用 加 转 相 除 法 很 快 得 到 9 二 4, 故 收 方 记 要 解 的 
是 
c=59x 4 三 32 (mod 51) 
a 32=ZX1+372,+672s +127, + 257s 
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二 1+6+25 
即 原 信号 为 19101， 至 于 敌 方 所 要 解 的 是 

59=13xX1 + 397%, + 277s + 37X, + 19r5s 
这 自然 不 算 太 难 。 但 我 们 可 以 看 见 a 失去 了 任何 规则 ， 当 n 很 
大 时 就 不 容易 解 开 了 ， 


84 瑞 未 斯 特 、 希 米尔 、 爱 得 曼 
(Rivest、Schamir、Adileman) 法 


这 个 方法 是 上 列 三 位 科学 家 在 1978 年 所 发 表 的 ， 其 步骤 如 
下 《如 图 6): 


收报 方 (秘密 作业 ) 公开 通读 发 报 方 (秘密 作业 ) 
1. 取 出 大 质数 D、 Q 及 与 | | 信和 号 (zi 人 89 **y ze) | 
(p-1)(q-1) 互 质 | 
的 C 令 1 = pq 
本 | 
(m, a) 
| 2. 出 (m, a) | 13,。 令 Ci=z? (mod m) 
| | i=1, 2， “1 并 
4。, 由 (C1， Co，…， Ca) | 发 出 C， 
解 出 (z1， Ta, | (C1, Ca， Ce) 


图 6 (RSA 制 码 法 ) 在 此 作业 程序 中 ，m，0，c1，…，C, 是 公开 的 


1. 收 报 者 取 两 个 相 异 的 大 质数 Pp、4q 及 另 一 与 (p ~ 1)(4 ~1) 
互 质 的 数 c， 且 a<w， 令 
w=(p-1)(q—-1), m= pq 
及 p、4 之 较 小 者 的 位 数 〈 十 进位 ) 为 K。 
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2. 《公开 ) 告 诉 发 报 者 k、m 与 4。 
3， 发 报 者 将 他 的 信号 分 成 许多 段 ， 每 段 含 #1 位 数 〈 和 十 
进位 ), 若 k= 3《 即 p、4 均 为 不 小 于 二 位 的 数 ), 则 信号 
331414320001 
应 分 成 
33，14，14，32，00，101 
(一 个 一 个 的 考虑 发 出 )， 设 发 报 者 的 信号 之 一 为 Ck ~ 1 位 数 ， 
即 上 例 中 的 33， 或 14， 或 323，…)， 则 他 将 它 作成 
c=X’ (mod m) 
发 出 。 
4, 收 报 者 收 到 c 之 后 ， 即 可 把 原来 的 > 求 出 来 ， 因 与 W 互 
质 ， 由 定理 2.2 及 推论 1 知 ， 我 们 可 找到 二 整数 4、e，d>0 使 得 
ad+we=1 
令 
y= cmod m) 
则 此 y 即 发 报 者 之 z。 我 们 先 证 明 y=z。 
38 三 cd 二 (22)4 王 Zad 
三 1-oe 
=7rX(r "(mod m) (4.1) 
但 因 w、a、d 均 为 大 于 1 之 整数 ， 故 e 必 为 一 负数 , 即 -- e 为 一 正 
数 ， 又 因 x 小 于 质数 p、g， 故 +* 同 m 互 质 ， 由 推论 ;得 
Ze (TD =1(mod m) 
故 (4.1) 或 成 为 
Yr(2") =71=7r(mod m) 
但 因 y 与 ? 均 取 小 于 mm 之 数 ， 故 y=z， 故 本 程序 之 正确 性 得 证 ， 
这 种 密码 的 关键 在 于 P、9 为 两 大 质数 时 ， 分 解 凡 成 为 p、4 
为 一 件 极 费时 的 工作 ， 若 分 解 不 开 m， 则 找 不 到 w 与 4， 因 此 就 
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无 法 从 c 解 得 >x。 在 不 久 以 前 ， 要 分 解 一 个 数 的 因子 仍 停留 在 近 
乎 硬 试 的 阶段 ， 即 要 从 2，3，5，7…， 一 直 试 到 wz 附近 才 停 
止 。 若 nh 是 50 位 数 而 p、4 均 近 25 位 数 ， 则 分 解 m 要 除 约 10 次 ， 
著 以 电子 计算 机 以 每 秒 105 次 的 高 速 运 算 , 这 仍 是 一 个 10' 年 的 
工作 ， 目 前 由 于 大 家 对 这 方面 的 重视 ， 分 解 一 个 50 位 数 的 时 间 
已 可 缩短 至 101" 次 运算 ，。 下 面 的 表 中 列 出 了 目前 (1980 年 )， 分 
解 一 个 大 数 大 概 所 需 的 时 间 。 


机 的 位 数 分 解 扩 的 最 少 运算 次数 最 快 (1980 年 ) 电 脑 折 费 的 时 间 


50 1.4xX10" 3.9 小 时 
70 9.0x1012 104 天 

80 1.3X1018 150 天 

100 2.3X1017 74 年 

200 1.2X1023 3.8 X109 年 


车 取 p .4 各 为 40 位 数 在 目前 已 经 十 分 安全 了 ， 即 使 是 25 位 
数 ， 在 商业 上 也 十 分 安全 ,因为 3.9 小 时 最 快 电脑 的 计算 费用 也 
是 一 笔 大 的 财富 。 

读 考 也许 要 问 这 种 40 位 左右 的 大 质数 是 否 很 多 ， 而 且 容 易 
找到 否 ? 管 案 是 ， 这 类 大 质数 既 多 而 且 不 难 找 (是 指 可 用 电脑 
很 快 制造 出 来 ) ,前 面 已 谈 到 找 一 个 大 质数 不 宜 用 硬 除 的 办 法 ， 
但 因 找 它们 所 用 的 定理 比 我 们 已 证 明 的 几 个 要 难 ， 我 们 将 在 下 
节 中 才 介 绍 出 来 ， 我 们 只 谈 一 下 质数 的 分 布 ， 依 据 质数 定理 在 
1 与 n 之 间 的 质数 的 有 nm/inn 个 ,因此 小 于 10‘"《 即 40 位 ) 的 质数 约 
有 


104/in104? ==10>10%* 个 
92.1 


。32.。 


这 又 是 一 个 天 文 数字 ， 因 为 一 个 ~- 千 顿 电子 计算 机 中 所 言 的 原 
子 数 不 过 10? 左右， 可见 这 种 密码 之 难以 提 摸 了 。 现 取 两 个 用 
来 做 密码 的 三 十 位 质数 以 篇 读者 ， 
p=5862031427 1421210354 0772438083 
q=7976488510 8326808223 7297393713 
要 分 解 
m= pq 
一 4675842632 8739231725 4879360844 
x 8514393251 3976539392 0565972179 
若 不 懂 数 学 与 计算 机 ， 则 是 谈何容易 。 在 本 节 结 束 之 前 ， 我 们 
也 举 一 个 例子 ， 当 然 我 们 不 会 用 上 列 的 大 质数 ， 我 们 且 取 P，4 
均 为 两 位 数 ， 令 
p=47, q=59 
则 m=p4= 47X 59=2773 
w=(p~1)(4 -1)=2668 
取 a =157， 由 轧 转 相 除 可 得 


176 一 1 多 三 1 
故 d=17 
故 收 方 发 出 的 密码 法 是 


m=2773, a=157, k=2 
此 时 发 方 必须 一 位 一 位 的 发 出 信号 ， 设 第 一 个 要 发 的 信号 是 3， 
出 他 要 发 出 的 是 
: C=" 二 3'5'(mod 2773) 
c 之 求法 主要 在 将 157 分 成 2 进位 数 并 用 定理 2*1， 即 
r=(x(mod m))’: (mod m) 
因 157 二 27+2*+2;+2?+1, 而 
3 三 3C(mod 2773) 
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3 二 9C(mod 2773) 
3*'=9:=81(mod 2773) 

3*' 三 81 二 1015(mod 2773) 
37' 三 1015: 二 1442(mod 2773) 
3*' 三 1442* 三 2387(mod 2773) 
32' 三 2387: 三 2027(mod 2773) 
32' 三 2027? 圭 1916(mod 2773) 


3157=1916 x 1442x 1015 x 81 x 3(mod 2773) 
二 964x 1015 x 81 x 3C(mod 2773) 
三 2364 X81x 3(mod 2773) 
三 441(mod 2773) 
因此 c= 441 即 发 方 发 出 之 信号 ， 当 收 方 收 到 441 之 后 ,用 同样 的 
运算 法 可 得 为 
441''=441*'+!(mod 2773) 
三 371?'Xx 441(mod 2773) 
三 1764?:' x 441(mod 2773) 
三 3902X 441(mod 2773) 
三 3(mod 2773) 
解码 完成 。 由 上 面 的 运算 可 知 车 没有 电子 计算 机 ， 则 解 与 做 这 
种 密码 是 何等 的 辛 苔 。 


$5 ”如何 寻找 大 质数 


现在 也 许 你 有 兴趣 学 一 点 难 一 些 的 数论 定理 了 。 
定理 2,5 设 4、m 互 质 ， 生 
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ab=ac(mod m) 
则 b=c(mod m) 
证 明 ， 因 ob- c) 反 0Cmod mn) 而 a 不 含 之 因子 , 故 b-c 必 


为 mn 之 倍数 ， 即 6 一 c 三 0C(mod m)， 本 定理 得 证 。 


定理 2.6 设 m 为 一 自然 数 ，4$Cm) 表 示 所 有 小 于 mm 且 与 m 互 


质 的 自然 数 的 数目 ， 又 以 7 1，?。，…， rs in) 表示 这 些 自然 数 ， 
如 果 a 与 m 互 质 ， 则 ar 1，ars…ars ow) 对 Cmod 如) 而 言 是 ?1,7,， 
,rocm) 的 一 个 排列 。 


证 明 , 令 7x;=ar.(mod m) 
且 0<2zi< mm 
则 ar 一 4 十 Ti 


因 ar. 与 m 互 质 ， 故 xX; 必 与 m 互 质 ， 因 此 Xx; 是 7 1，?。，…， 


rim 中 的 一 员 , 但 由 定理 5.2 知 x, 三 zj(mod m) 的 充 要 条 件 为 7， 
=7j, 故 所 有 的 x; 皆 不 相同 ， 本 定理 得 证 。 


定理 2.7 〈 费 马 、 尤 拉 定 理 ) 设 w 与 m 为 两 互 质 的 自然 数 ， 


$ 为 尤 拉 函数 ， 则 


wm)=] (mod m) 
证 明 ， 由 定理 2.6 知 
Fir 2 cn) 
三 (Wr Wr ) Wr, my) (mod m) 
即 YF Fe (nm) 
We rr mn) (mod m) 
因 7 14? 27s 4m) 与 mm 互 质 ， 故 
We 二 1 (mod m) 
本 定理 得 证 。 
(此 定理 为 定理 2.3 的 推广 ， 因 加 为 质数 时 $m) =m ~ 1) 
我 们 又 可 以 推广 定理 2.2， 车 以 (4，6) 表 示 t、5b 的 最 大公 


e@ 35 。 


约 数 ， 若 d= Ca，65)， 则 存在 两 整数 z，y 可 使 
az + by=d 
这 个 证 法 与 定理 2.2 极 相似 ， 求 法 也 是 用 轧 转 相 除法 。 

定理 2.8 设 a、m 为 两 个 互 质 的 正 整 数 且 1<4<m， 若 a* 
三 1 (mod m)， 则 & 与 $m) 不 互 质 ， 

证 明 ; 设 4 为 所 有 R 之 1 且 满 足 

ai=1 (mod m) 
的 数 的 集合 ， 因 4(m)7EA， 故 4 为 非 空 集 合 。 令 d 为 A 中 之 最 小 
数 , 因 4! 三 aCmod m)， 故 1 EA4， 即 d>1， 设 4 三 1(mod m), 令 
R=dqd+r，0<r<d， 显 然 由 ad 三 1(mod m) 可 得 

1=a*=ar "r= (qa) a 

a'(mod m) 
但 因 d 为 此 集合 中 的 最 小 者 ， 故 7=0， 即 R 必 为 qd 之 倍数 ， 且 因 
$Cm) EA， 可知 djpCm), 从 而 (R，$Cm)) 之 d>1， 帮 k 与 pm》 
不 互 质 。 

现在 我 们 终于 走 到 了 最 后 一 个 求证 某 数 是 质数 的 定理 。 

定理 2,9 〈 重 克 斯 (Lucas) 定 理 ) 设 m 为 大 于 1 的 整数 ，a 
为 任 一 与 m 互 质 之 数 。 若 a"! 三 1C(mod m), 且 对 Cm 一 1) 所 有 的 
因子 p 而 言 ，o 关 1(mod m)， 则 m 必 为 一 质数 ， 

证 明 ， 设 mm 不 是 质数 ， 则 由 $Cm) 之 定义 可 知 pCm)<<m 1 
但 由 于 a、m 互 质 ， 由 定理 2.7 知 4* ‘三 1Cmod m), 由 已 知 条 件 
及 前 定理 知 

(m-1, $m))=d>1 
故 d 为 m 一 1 之 一 因子 ， 由 (5.17 知 存在 二 整数 z.y， 使 得 
(m- 1)r+ hm)y=d 
即 .dia mlst$ (nm) 


到 (Ga )* oe (at em) 


三 1(mod m) 

故 (m- 1) 有 一 因子 d 使 得 a: 三 1Cmod ma)， 与 假设 相 矛 盾 , 故 m 
必 为 质数 ， 本 定理 证 毕 。 

这 个 定理 车 用 来 检定 一 已 知 数 m 是 否 是 质数 并 不 容易 ， 因 
为 m- 1 的 因子 往往 不 易 找到 ,前 面 已 谈 过 要 分 解 一 个 大 数 的 因 
子 是 件 极 费时 的 事 ， 但 这 个 定理 来 找 一 些 大 质数 却 很 容易 ， 例 
如 我 们 令 

m=2"+1 

则 m1 的 因子 为 2，2?，…，2", 若 我 们 能 找到 一 个 与 m 互 质 的 
数 4?， 像 3、5、7?7 之 类 的 而 且 证 得 


a"™!==](mod m) 


但 a: #1(mod m) 
出 mm 必 为 质数 。 原 因 是 车 


2"-1 
a 三 1(mod m) 


则 对 所 有 的 hn 一 1，a:* 都 不 等 于 1(mod m)。( 假 如 ao = 1 
《Cmod m)， 则 


2"°71 


i 
a 三 [a? J: 


“= 1 (mod m) 


对 一 个 固定 的 4 而 言 ,这 个 整个 检验 过 程 不 过 一 次 验 定 4 与 
m 互 质 ， 二 次 Cmod m) 的 计算 而 已 ， 比 硬 除 快 多 了 ， 

例 ， 若 令 m=2"- 1， 则 我 们 车 能 试 出 一 与 % 互 质 的 数 4 像 、 
3，5，7，… 而 也 证 得 

"1=1Cmnod m) 

且 a2 关 1(mod my) 
及 qx” -1 关 1Cmod my) 
出 mm 必 为 一 质数 〈 因 mm- 1=2 -2=2(2" 1-1))。 目 前 最 大 的 
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质数 多 半 都 是 这 样 求 得 的 ， 在 1979 年 纳尔逊 与 斯 罗 温 斯 基 〈 芯 ， 
Nelson & Slowinski) 用 电子 计算 机 证 明 244497 -1 是 一 个 
13395 位 的 质数 。 若 以 100 元 一 千 字 作 稿 费 ， 把 这 个 数 写 出 来 就 
是 一 于 三 百 元 ,< 数学 传播 ;一 页 大 约 二 千 字 ， 记 以 把 这 个 字 写 
出 来 要 占 去 六 页 半 的 篇 幅 。 

例 ， 若 p 为 一 质数 ，s、t 为 两 正 整 数 ，m=2'5+ 1， 则 我 们 
车 能 试 出 一 个 与 m 互 质 的 数 a 并 证 得 


"1 二 1] (mod m) 
5 一 下 
且 apP: 关 1(mod m) 


02 pt1 关 1(mod m) 
则 mm 为 一 质数 ， 
例 ， 若 Pp、4 为 两 质数 ，m =2pq + 1， 则 我 们 若 能 试 出 一 个 
与 m 互 质 的 数 a 并 证 得 
or“!=1(Cmnod m) 
a2? 关 1(mod m) 
a2 关 (mod m) 
及 029 拓 1(Cmod m) 
则 mm 为 一 质数 。 
如 此 这 般 ， 我 们 可 以 由 小 而 大 滚雪球 式 的 很 容易 找到 许多 
大 质数 ， 由 于 走 的 路 程 千变万化 ， 所 可 能 找到 的 大 质数 也 是 一 
个 天 文 数字 。 当 然 电子 计算 机 是 不 可 少 的 工具 。 在 定理 2.9 中 
我 们 只 要 求 任何 一 个 与 m 互 质 的 4， 因 此 什么 与 m 互 质 的 a 都 可 
以 ， 根据 一 般 的 经 验 ， 若 tt 是 质数 ， 很 快 就 可 以 找到 一 个 小 的 
a 像 3、5、7 之 类 的 满足 定理 2.9， 若 不 成 功 ， 就 可 以 放弃 另 找 
了 ， 反 正 侯 选 的 m 多 得 不 得 了 ， 最 近 有 一 个 极 巧妙 的 结果 由 
lehmer，Soloorary 与 Shassen 同 时 发 现 。 即 车 m 不 是 质数 , 则 至 
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少 有 一 半 以 上 的 数 从 2，3，…， 到 m ~ 1 不 能 满足 sa" :三 1Cmod 
m), 可 惜 我 们 没有 办 法 在 本 文中 证 明 此 一 结果 。 这 个 结果 在 另 
一 个 角度 来 看 ， 即 一 个 不 是 质数 的 m 只 有 很 小 的 机 会 能 通过 许 
多 少 的 a4。 我 们 最 后 举 一 个 数字 的 例子 ， 
例 ，257==2 + 1 是 不 是 质数 ? 
民 -1= 22， 故 我们 若 能 找到 一 个 与 刀 五 质 的 c， 且 
a:'R1(mod m) 
a?' 才 1(mod m) 
m 即 为 质数 。m = 257 不 是 3 的 倍数 ， 我 们 先 取 4 =3, 我 们 一 步 ~ 
步 的 求 3:'(mod m) 与 3*'(mod m)。 


hk 2* 3* =? (mod 257) 
0 2'=1 3=3 
1 21=2 32=9 
2 2:=4 31=9:=81 
3 23=8 35=81=136 
4 24 一 16 136?=249 
5 25=32 249: 二 64 
6 25 =64 642 三 241 
7 27=128 241: 二 256 
8 2s =256 256? ==1 
故 257 是 一 个 质数 。 
86 结尾 的 话 


前 面 说 过 ， 在 重 赏 或 生死 交 关 的 情形 下 ， 至 今 尚 很 少 不 能 
破获 的 密码 ， 在 现今 数论 密码 一 日 千里 的 进展 之 下 ， 我 们 刚才 
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谈 到 两 种 密码 也 许 就 要 (已经? ) 落 伍 , 但 新 的 方法 必然 又 会 出 
现 ， 并 且 在 寻找 新 数论 密码 的 长 途上 ， 数 学 家 一 定 可 以 有 时 在 
路 边 捡 到 一 些 前 人 所 未 发 现 的 珍珠 。 有 一 天 人 类 也 许可 以 坦诚 
相处 到 不 要 用 密码 通讯 的 地 步 ， 但 这 些 抢 来 的 珍珠 将 永远 是 数 
学 史上 的 光辉 。 


补充 资料 


@ 据 1985 年 3 月 份 的 科学 新 知 (Science News) 的 报导 于 
1985 年 2 月 间 荷 兰 的 阿姆斯特丹 大 学 的 一 位 数学 家 再. W. Lens- 
tra Jr .发 表 了 仅 有 一 页 的 一 篇 有 关 分 解 大 数 法 则 的 研究 摘要 ， 
惊动 了 数学 界 。 据 一 些 读 到 详 文 的 专家 评论 此 方法 时 认为 ， 一 
般 说 来 ,是 要 比 目 前 其 它 的 方法 来 得 快速 有 效率 ,而 且 原理 也 很 
简单 ,并 称 对 此 方面 有 素养 的 专家 ,只 需 几 分 钟 就 可 把 此 方法 加 
以 描述 出 来 ,目前 不 少 人 正 埋头 写 有 关 此 法 则 的 电脑 运算 程序 ， 
以 便 进行 试验 ， 也 有 不 少 人 人 忙 着 发 气 此 法 则 的 应 用 及 用 途 ， 

此 新 法 据 称 与 具 y* =z*+ ax+b 形 式 的 椭圆 形 曲 线 有 关 , 式 
中 a、b 可 随机 地 取 定 ， 但 此 新 法 不 是 对 所 有 的 大 数 都 最 有 效 ， 
它 对 一 个 原由 三 个 或 三 个 以 上 质数 相 乘 积 的 大 数 ， 或 两 个 相差 
很 大 的 质数 相 乘 的 大 数 最 有 效 ， 因 而 此 新 法 对 我 们 上 面 介 绍 的 
“公开 通讯 ”的 密码 仍 不 至 于 构成 什么 大 威胁 〈 因 在 该 密码 中 ， 
我 们 可 取 两 个 相差 不 大 的 大 质数 作 我 们 的 大 数 。 当 然 理 论 上 来 
讲 ， 这 多 少 给 了 敌 方 一 些 线索 了 ) ,但 人 们 已 开始 对 此 密码 的 绝 
对 安全 可 靠 性 动摇 了 了， 希望 在 读者 中 能 有 人 很 快 地 将 此 饮 虑 造 
成 事实 ， 为 中 国人 带 来 灿烂 的 光辉 ， 但 要 有 进展 最 好 从 数论 及 
电脑 程序 设计 〈 软 硬件 两 方面 》 双方 的 配合 着 手 ， 才 能 得 到 真 
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正 有 效用 的 新 法 风 。 

四 在 6 月 25 日 华 府 邮 报 (Washington post) 科 学 栏 的 密码 报 
导 两 位 年 青 的 数论 专家 ， 一 位 是 贝尔 实验 室 的 蓝 司 特 拉 〈A。 
Lenstra) 及 数据 设备 公司 (Digital Equipment corp) 的 马 拿 
塞 CM. Manasse) 在 世界 各 地 二 百 多 个 研究 员 的 协助 下 〈 主 要 
是 利用 他 们 的 电脑 来 计算 ， 约 1 千 架 电脑 的 空间 时 间 来 进行 运 
算 ) 花 了 几 个 月 的 时 间 ， 把 以 前 一 直 认 为 无 法 去 分 解 的 一 个 具 
155 位 数 分 解 出 来 了 (所 谓 无 法 分 解 是 指 以 当时 的 一 架 计算 机 的 
计算 量 来 计 有 生 之 年 是 完成 不 了 的 )。 

13,407,807,929,942, 597, 099,574, 024, 998, 205,846， 
127,479,365, 820,592,393, 377, 723,561,443,721,764,030， 
073,546,976, 801,874, 298, 166,903,427, 690, 031,858,186， 
486,050,853,753,882,811, 946, 569,946, 433,649,006,084， 
097 
=2,424,833X7,455,602,825,647,884,208,337, 395,736, 

200,454, 918,783,366, 342,657 xX 741,640,062,627,530, 

801,524,787,141,901, 937,474,059,940,781,097,519， 

023,905, 821,316,144,415,759,504,705, 008,092,818， 

711, 693, 940,737 

而 目前 一 般 商 用 、 外 交 或 军事 上 靠 电 话 线 传递 数值 化 的 分 
开 密 码 也 不 过 是 用 155 位 的 数 来 制造 的 ,而 且 一 直 认 为 至 少 在 本 
世纪 结束 前 以 目前 一 架 电 脑 计算 量 来 衡量 是 可 保险 的 。 所 以 上 
面 的 一 个 突破 的 确 曾 引 起 了 一 些 使 用 密码 者 的 担 忱 。 好 在 上 面 
的 155 位 数 是 属于 一 种 特殊 的 数 ， 即 所 谓 的 “ 费 马 数 ”《〈 见 形式 
2” - 1 的 数 )。 而 且 该 两 位 数学 家 也 承认 他 们 的 方法 对 别 种 形 
式 的 大 数 分 解 不 见得 有 效 。 

四 MIP 一 年 及 分 解 大 数 的 计算 估计 。 


首先 我 们 称 一 部 电脑 以 每 秒 进行 一 百 万 次 加 减 运算 ， 不 断 
进行 一 年 的 计算 量 为 一 个 MIP 年 ， 

现 我 们 来 介绍 一 下 如 何 对 大 数 的 分 解 的 时 日 有 所 估计 ， 依 
据 R. Rivest 在 他 的 一 篇 投 书 (Science,，Dec.16，1988, P. 
1493) 中 指出 ,一 般 对 一 个 n 位 数 如 照 当 时 最 好 的 运算 法 来 分 解 ， 
其 计算 量 为 expCInCn)IinlnCn))5 2。 特别 对 一 个 100 位 数 的 分 解 
需要 25 个 MIE 年 。 一 般 说 来 位 数 在 100 到 300 位 问 的 大 数 ， 每 增 
加 一 位 ， 则 其 分 解 的 计算 量 的 增加 20%.。 

也 因 有 此 估计 ， 所 以 公开 性 的 数字 密码 的 保密 性 是 相对 人 制 
码 的 位 数 n 与 电脑 计算 量 的 改进 而 言 的 。 
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2 .Simmons，G, “Cryptology，The mathematics of SewTe 
communication” The Mathematical Intelligencer，1978， 
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3 .Hellman. M. E. “The mathematics of public—key cryptogra— 
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4.Pomerance，C.“The search for prime numbers” Scientific 


American, December, 1982, Pp. 136 一 147。 
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第 三 章 ”数字 密码 的 一 些 新 研究 


0 中 


$1 前 


在 前 文中 我 们 介绍 了 Rivest-Schamir-Adleman 在 1978 年 发 
表 了 一 种 破天荒 的 数字 密码 。 它 和 往常 密码 不 同 之 处 是 ， 拍 发 
及 接受 两 方 都 不 必 怕 拍 出 的 数字 密码 中 途 被 人 截 接 侦破 ， 只 要 
收 方 保 有 一 组 解码 的 数字 组 ， 用 来 把 拍 出 的 数字 转换 成 原来 未 
拍 出 前 的 数字 即 可 ， 其 中 所 用 的 原理 是 整数 论 中 的 所 谓 “ 中 国 
人 剩余 定理 ”, 也 是 国人 所 称 的 “韩信 和 点 兵 术 ”， 及 若 仅 知 一 个 大 
数 N， 其 为 两 个 大 质数 pi、 D: 的 乘积 ( 即 N=pips)，, 但 要 把 这 两 
个 质 因子 pi 、.P, 找 出 是 很 困难 的 事实 (一 : 般 如 果 N 为 一 个 百 位 
数 ， 照 目前 已 知 找 质数 的 方法 及 最 快速 的 计算 机 来 计算 ， 日 夜 
不 停 地 进行 计算 ， 也 至 少 要 花 上 九 年 的 时 间 ), 所 以 上 面 提 的 密 
码 算是 目前 最 具 保 密 性 的 了 。 但 在 该 法 中 ， 拍 码 及 译 码 (解码 ) 
时 都 用 到 了 大 数 的 高 宕 次 计算 ， 所 以 计算 量 很 大 ， 这 是 一 个 缺 
点 (但 也 确保 了 保密 狂 )。 
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在 1979 年 两 位 华裔 的 工程 师 S. C, Lu 及 L. N. Lee， 介绍 了 
一 个 较 D-H 两 氏 方法 简便 得 多 的 一 种 密码 [1], 它 也 是 利用 中 国 
人 剩余 定理 及 找 大 质 因子 困难 的 事实 ， 但 发 码 时 只 涉及 儿 个 乘 
法 及 对 模 数 的 加 法 , 译 码 时 只 涉及 解 一 组 二 元 一 次 方程 式 .虽然 
Lu-Lee 两 氏 在 他 的 文中 声称 具有 高 度 的 保密 性 ,但 在 文 [1 发 表 
的 同年 就 有 人 撰文 在 [3 及 [人 中 指出 Lu-Lee 两 氏 密码 的 破绽 。 

1985 年 两 位 印度 工程 师 提出 了 一 篇 对 Lu-Lee 两 氏 方法 的 修 
正文 章 [2]， 并 且 声 称 此 法 至 少 可 以 抵挡 [3 及 [4 两 文中 的 破 “ 
法 ,我们 在 本 文中 将 先 介绍 Lu-Lee 两 氏 的 密码 法 及 其 破绽 之 处 ， 
然后 介绍 、 讨 论 [2) 文 中 所 作 的 改进 ,最 后 我 们 把 最 近 在 数学 界 
有 关 质数 的 检验 法 的 进展 当 作 补充 资料 作 报导 ， 希 望 读者 能 了 
解 最 新 的 研究 ， 在 此 方面 作 急 起 直 追 的 努力 。 


§ 2 LU-Lee 密 码 方法 及 原理 


除非 特别 声明 外 ， 本 文 用 来 代表 未 知 数 及 已 知 数 的 文字 都 
是 指 的 整数 ， 我 们 将 就 拍 码 (或 编码 ?法 及 解码 (或 译 码 ) 法 作 解 
说 。 

拍 码 法 ， 

设 m1 及 m, 为 两 个 要 送出 的 数字 码 ( 或 信息 ), 我 们 可 不 妨 限 
定 0<m<M 1 及 0<m,<<M，,， Mi 及 M ,为 有 关 数 码 m ,及 m ,的 
上 界 。 以 下 我 们 要 指出 如 何 定 此 上 界 ( 这 与 解码 有 关 )。 我 们 可 
以 公开 一 组 与 拍 码 有 关 的 数字 组 (cl，c:， 门 。 

现 所 要 拍 出 的 解码 为 x， 

x 二 (cim+eom,) modr (C1) 


解码 法 ， 
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收 方 必须 具有 一 组 可 以 由 x 得 出 mi 及 :的 解码 数字 组 
AN Ais Gr2g G21y 02s2, PD1, Pos) 此 组 为 保密 的 。 
则 当 甲 方 拍 出 z 时 ， 乙 方 作 如 下 的 计算 ， 
T=xCmod p1), +,=x(mod py) (2) 
得 了 zi 及 z; 后 ，mi 及 ms 可 由 下 面 公式 得 出 ， 


m, 一 71035 一 72011: ~ 
下 
Qi1102.. ~ 0 .4,1 


(C3) 


TA11~T 0,! 
G11052 ~ 010s1 
任何 一 解码 必须 要 满足 对 于 拍 出 不 同 的 rz， 一 定 得 出 不 同 的 m， 
及 ,， 否 则 就 混淆 不 知 原来 的 数码 了 , 如何 有 此 种 保证 ? 这 与 
参数 c1,，cs;，r， 及 G11，G1:，02:，4s1，M ,及 M ,的 选择 条 件 
有 有关， 以 下 我 们 就 讨论 如 何 选 取 这 些 参数 


m, =- 4) 


选 参数 的 条 件 ， 
1.c1 及 r、c: 及 7 皆 为 互 质 ，r 为 两 个 大 质数 p: 、pz 之 乘积 ， 
其 
(ci1, fF)=(c,, F)=1, r=pip, 《5) 
并 且 进 一 步 要 求 
Cl+Co ZI 


现 要 保密 的 解码 参数 组 (a11，41;，0,1:，4,2，pP1，P:) 参 
数 都 是 要 保密 的 ， 但 它们 之 间 要 满足 下 列 关 系 ， 


2, ‘GCCmod pi) 1s=6,Lmod:p) 


Qi 三 Ct,(mod p,), ts;sEc.mod ps) 《67 
并 且 要 求 | : | - 

G110,..— 0120,1 0 | . 《7)》 
这 是 很 明显 的 一 个 要 求 。 
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3.M: 及 M ,要 求 满足 


二 1 ,fd ql 
wa 
'* 2 人 Gil ga (8) 
M:<| 二 min! 4 ， -2 (9) 
2 Gls 02: 


其 中 g=minf{p,， Pp,}，[y] 表 y 的 整数 部 分 。 
现 我 们 看 解码 成 立 的 过 程 ， 
对 式 (1) 两 边 取 模 数 p,， 由 同 余 的 原理 可 得 ， 
rz! 三 X(mod p1)(cimi+cam,)mod p1) (10) 
或 XY 三 x(mod p1) 
三 [c,(mod pm + cmod pi)m;]Jmod pl) 


=(a ii + 4 .mmod pi) (11) 
由 条 件 (8) 及 (9) 可 知 911m1 +aism3s< 和 pi， 因 而 
T=0 m+01,m, (12) 
同 理 可 得 
Ts=4, m1 +0,,m, (13) 


解 方程 式 (12) 及 (13) 可 得 m ,及 m,， 如 (3) 式 及 (4) 式 ,此 解 的 在 
在 及 唯一 性 是 因为 46110, 一 412941 寺 0， 又 注意 m; 及 m, 篆 为 整 
数 。 

读者 不 难 发 现 这 个 方法 的 计算 量 很 少 。 


参数 的 选取 ， 
大 参数 p, 及 ps。 的 选取 可 依据 Solovay 及 Strassen[6 所 提出 
的 有 效 的 或 然 率 选 法 。 一 旦 p1 及 p, 选 了 ， 就 可 选 4, |!，a,，,， 
,1 及 as :满足 41102 :一 401.9041 起 0， 然 后 由 于 P1 及 P, 互 质 ， 由 
Euclid 的 辑 转 相 除 法 可 得 ， 
bip1+h,.ps=1 (14) 
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对 上 式 两 边 同 羔 以 (a,， -G1 1), 经 并 项 后 可 得 


C=[(4,,— a pi +arlmod r) (15) 
或 

C1=[(G11 -asi)psps+as Cnod r) (16) 
上 式 中 1 ==p,p;。 同 理 可 得 

cs[ (G2, -app +a1s mod r) (17) 
或 

Cs=[(41, ~ G92 sDs + 04,21 (mod r) (18) 


下 面 我 们 举 一 个 实际 计算 的 例子 C51] 文 中 的 ), 由 此 例子 我 
们 可 得 到 一 点 端倪 ， 为 何 此 法 易 被 侦破 了 当然 参数 选取 的 种 
种 限制 也 多 少 提供 了 一 些 线索 )， 
例子 ， 取 D1=97，P; 二 103， 及 411=3，41; = 二 2，4,1=5， 
a,, 二 4 作为 解码 的 参数 组 (这 是 要 保密 的 ), 现 r =p1p, 二 9991 及 
1=17x97-16x 10 可 得 61=17，6,== - 16， 于 是 发 码 的 参数 
组 (c1，c:;，r)( 这 是 要 公开 的 ) 中 的 c1 及 cs, 可 得 如 下 ， 
ci1=2X17X97+3=3301 
cs=2xX17x97+2=3300 
现 我 们 能 拍 送 的 数字 码 m ;及 m, 能 有 多 大 ? 


wa 人 区 |-， 


M,<|3 min( 字 ， 9)]=12 


换 色 话 m, 及 m; 的 选择 不 能 分 别 大 于 9 及 12, 现 我 们 比方 取 m, = 
7，Mm。 二 5( 或 用 二 进位 制 m, =0111 及 m; =0101)。 
拍 发 的 明码 为 
rz 三 [7 x 3300+ 5x 3300jC(mod 9991) 
三 9634 
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因而 
zi 一 9634Cmod 97)=31 
2,=9634C(mod 103)=55 


3m; +2m,=31 
5m1 + 4m,=55 
得 到 m=7 及 m, 二 5，、 即 原来 的 数字 信息 。 
在 文 [2] 中 Lu-Lee 两 氏 也 曾 讨 论 了 一 些 可 能 的 破绽 ,不 过 他 
们 总 结 只 要 D, 及 PD; 取 得 够 大 , 及 一 般 4;; 也 取得 相当 大 就 可 避免 
被 侦破 的 危险 ， 但 4;; 一 大 ，M ,及 M :就 要 减 小 了 , 这 个 矛盾 是 
在 C2] 文中 所 要 对 付 的 ， 下 面 我 们 就 介绍 此 一 改进 的 方法 。 
首先 在 C2] 文 中 指出 的 是 在 [3] 及 [4 的 两 篇 文中 利用 拍 送 
出 不 同 的 明码 ， 经 过 译 码 得 到 不 同 的 原 码 的 事实 ，Lu-Lee 两 氏 
的 密码 可 以 不 必 知 道 p1 及 p; ,照样 可 把 m4 及 m; 求 出 。 另外 在 文 
[43 中 指出 由 于 当 ci(Ci= 1,2)7 取 P, 或 p, 为 模 所 得 的 剩余 数 a,, 值 
都 很 少 〈 这 是 因为 要 求 clii +4i,m,<p:，i=1，2)， 所 以 依 
此 事实 可 以 把 pj 及 Dp, 求 出 ， 之 后 可 求 得 a.;，。 


§ 3 Lu-Lee 法 的 改进 


参数 选取 : 

如 同 Lu-Lee 法 一 样 ， 译 码 的 秘密 解码 组 为 -- 组 数 (pl*p:， 
ai，i=1，2，j=1，2) 及 公开 的 发 码 ， 参 数组 为 (cl，czyr)， 
但 要 求 a; ;满足 

(1) 01:>0,,。 

(2) qs oil 
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(3) 4;;，i 二 1，2，j=1，2， 每 个 信 不 小 于 2:*， (或 二 进 
位 制 200 位 的 数字 ) 。 

(4) 对 于 M ,及 M: 我 们 要 求 M 过 259，M :<25 

假定 我 们 国定 取 p ,及 Pp; 丝 为 二 进位 下 具有 252 位 数 的 值 ( 因 
而 + 为 一 在 二 进位 表示 有 共有 504 位 数 的 值 )， 就 可 以 使 得 (5) 满 嘴 
了 。 


发 码 ， 

(1) 首先 我 们 要 求 发 的 数码 六 不 大 于 2 99" 《〈 即 在 二 进位 下 
至 多 为 一 个 199 位 数 ) 。 

(2) 任 选 一 组 整数 (mm ，P)，1i 和 Mi，ms 万 M,， 朱 出 
下 列 明 的 数字 码 

m=(micmitc.m,)mod r) 

换 名 话 ， 把 Lu-Lee 中 的 明码 加 上 了 一 个 因子 mmod 1r), 注 
窟 的 是 这 时 我 们 是 一 次 送 一 数码 ， 解 一 数码 。 

我 们 首先 看 这 个 密码 法 会 不 会 产生 混淆 ， 即 不 同 的 原 码 尹 
及 m' 其 相应 的 m, 及 m: 是否 可 能 会 相同 ? 

所 以 我 们 候 设 m 六 m/ 看 m=m: 可 不 可 能 ? 


今 
me=(cmi+cm, +m)(mod r) 
三 {(cim +cm,)(mod r)+m(mod r)}(mod r) 
三 (zs+ 玉 )(mod r) 
回 理 可 得 
HE(zI+HMD)COmnod r) 
及 


me(modp1)={r,(modp,)+m(modp,)}(modp!) 
三 (XZ, +m)(modp,) (19) 
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mmod p,)=(7, +m)(mod p,) (20) 

m,(mod p.)=(z: +m’)(mod p),i=1, 2 (21) 
于 是 由 m.==ms 两 边 取 p; 为 模 数 的 余 式 相等 下 ， 利 用 上 面 三 式 可 
得 : 

(z+m)(mod pi) 反 (Zi+H DCmod pi);i=1,2 (22) 
即 

(zzCmod p)=(m-m’)(mod pD i=1, 2 
因 m，m’，z:，ZX; 和 小 于 p;:，i=1，2， 族 

Zi-X!==(m~-m’); i=1，2， 因 而 

TI—T! IN -Mor ~ (23) 
注意 | Cm-m )[ 才 ai i=1，2 及 j=1，2， 依 定义 x, 及 式 (6) 

和 

T=0,.Mm+0G,,.m, 
及 

2 一 GT Go 

上 
由 上 面 两 组 方程 组 及 (23) 可 得 

Gi mm) tam ~ m:) 

=ay1m ~ mi) + a4, m, ~ m;) 
于 是 

(al -Om -mi)=(0s ~ 0 mM ~ m:) (24) 
由 于 上 式 两 方 必须 为 同 号 ， 帮 mm, ~ m1! 或 ;~ m; 同 为 正 或 同 为 
负 。 车 同 为 正 ， 则 依据 式 (23)、 由 式 (24) 可 得 ， 

m-m’ = 7/=a 1mm/) ta,(m, ~ m;) 

DG11 二 Gi2 

此 与 m 与 m’ 之 大 小 规定 不 符 ， 同 样 在 m ,一 mi 及 ms 一 加 ; 同 为 负 
时 亦 可 得 同样 的 了 矛盾， 所 以 车 m 志 m ， 则 mso 丰 h。，。 
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84 改进 码 的 解码 步骤 


计算 m6: 二 mCmod pi); 7 一 1，2 (C25) 
解 下 列 联 立方 程 组 〈 未 知 数 为 三 及 t+， 其 解 可 能 为 有 理 数 ， 不 
一 定 为 整数 ) 。 
必 (26) 
dysitit+assts=m,, 


到 k, = [ft ] 及 Rs = [ts] (27) 
计算 aiki+aiskhs=m’ i=1，2 (28) 
了 到 m=me;~ m’, (29) 

我 们 现 看 上 面 每 一 步 又 是 否 合理 ? 主要 是 找 出 步骤 (26) 中 
hs; 与 me 及 检验 步 又 (29)。 


任何 一 有 理 数 : 都 可 成 式 1=[ 归 + [和 ?= 整数 部 分 + 
小 数 部 分 。 所 以 不 妨 设 
t=[t,] +r;/ 人 人 


A=|, 二 4110z2 ~4s1412， 为 一 适当 的 有 理 数 ， 使 
21 22 
得 ri/A 为 二 之 小 数 部 分 。 


现 我 们 把 步骤 (26)7 中 的 方程 组 改写 为 下 面 的 形式 ， 
Gi1iti 十 Gofo 二 和 十 于 
《 即 以 z1+ 机 表 m。1，X :为 一 参数 ) 
Qs2ty tassts—=T ,+m 
( 即 以 Z。+ 讽 表 m。,，X ;为 一 参数 ) 
”以 下 我 们 将 证 明 z; 为 步骤 (28) 中 的 mc; 1 2。 这样 步 又 (29) 
亦 成 立 ， 原 数码 也 就 得 到 了 。 解 上 面 方程 组 得 
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(Ca at /A tm ~ 1)/A 
lis anz)/ Arm-a nN)/(- A 
由 于 我 们 将 希望 看 到 的 是 7; 为 ms.( 二 ai1h1+4;sk,)， 所 以 我 们 
不 妨 设 
全 将 
Zi 十 Qt 
再 证 明 m .与 m ,事实 上 分 别 等 于 R ,及 &, 就 得 了 。 由 上 面 方程 组 
可 得 : 
HI 人 A 一 02271 一 G1225 
(a A 
将 此 组 结果 代入 t 及 +, 之 值 中 得 
{人 
tf,=m;+m(as 一 ai) 人 -人 ) 
由 于 参数 选取 的 条 件 ， 可 验证 得 m(a ,~4a12s)/ 人 入 及 mta,) 
一 411)/~ 人 和 皆 为 小 数 `。 
[t1]=mi 及 [i,1=m, 
因而 在 解码 的 步骤 (28) 中 所 计算 的 为 方程 组 
TI=a 十 Go 
(a ma om 
中 的 z: 及 7。 
有 了 下 及 Za 一 fcs 
ZI 十 人 一 He 及 XT,+m=m,, 
因而 
步骤 (29) 也 就 自然 成 立 了 。 


讨论 问题 
在 发 码 步 又 (2) 中 ， ff 二 (1 +Ccii t+Ccso)mnod 2), 但 
e 52 。 


+ Cm + coms 也 可 天 成 Wt+ci~csot+c1Cmi1)+ em 十 1)， 
后 者 相当 于 一 个 人 要 求 发 的 码 为 m+ c,~c,， 选 的 整数 组 为 
Cm -1，mas+1l)。 对 收 方 来 说 他 收 到 相同 的 值 m。, 为 何 此 改进 
法 仍 可 用 ? 读者 不 妨 试 由 值 %，a.j，P1，P: 等 的 大 小 ， 来 补充 
证 明 m. 不 可 能 同时 以 上 列 二 种 形式 来 产生 。 
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为 了 提起 读者 研究 的 兴趣 ， 我 们 在 此 顺便 介绍 最 近 在 美国 
科学 杂志 (Science，vol.231 1985，p.452 一 453) 指 导 的 有 关 质 
数 检 验 法 的 一 些 最 新 发 展 ， 

过 去 十 年 以 来 ， 出 现 了 许多 有 关 质 数 的 检验 ， 但 都 有 它们 
独特 的 短处 ， 所 以 迄今 为 止 仍 无 一 个 十 全 十 美的 方法 。 在 1975 
年 左右 任职 险 佛 大 学 及 希 伯 来 大 学 的 M.Rabin 分 别 与 伯 克 菜 加 
州 大 学 的 R .Solovay 及 瑞士 苏 黎 士 (Zurich ) 大 学 的 Y.Strassen 
两 人 小 组 ， 各 自发 现 了 一 种 或 然 率 的 质数 检验 法 ， 此 检验 法 容 
易 且 快速 。 所 谓 快 速 是 指 用 计算 机 来 照 此 方法 的 程序 运算 ， 所 
需 的 时 间 是 多 项 式 时 间 (Polynomial time 较 具 体 的 讲 , 所 需 的 
四 则 运算 的 次 数 为 之 cw，n 为 所 要 检定 的 正 整 数 ，k 及 c 为 两 常 
数 。 详 情 可 参看 下 章 ), 但 由 于 它 的 或 然 性 ， 使 得 一 般 人 存疑 ， 
也 因此 不 敢 照 用 此 法 .这 个 方法 使 得 当 一 个 人 用 它 去 试 一 个 数 ， 
如 果 检 验 得 出 的 答案 是 非 质数 ， 他 一 定 可 以 相信 也 即 结论 一 
定 是 正确 的 ), 但 如 果 得 出 是 质数 的 答案 ， 那 就 不 一 定 百 分 之 再 
的 可 信 了 。 因 此 理论 上 这 个 方法 不 能 用 来 检验 哪个 数 为 质数 。 

儿 乎 在 同时 ， 南 加 大 的 G.Miller 发 现 了 一 个 非 或 然 性 的 质 
数 检验 法 。 她 的 方法 可 以 很 快 (多 项 式 时 间 》 地 把 一 个 原 非 质 
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数 的 数 ， 正 确 地 判断 出 来 .但 若 一 个 数 经 检验 得 的 结论 是 质数 
的 话 ， 是 不 是 一 定 正 确 ， 却 要 看 数学 上 有 名 的 推广 的 黎 曼 氏 假 
说 (Extended Riemann Hypothesis) 是 否 成 立 而 定 。 因 此 假如 该 
假说 被 证 明 是 错误 的 话 ， 许 多 由 Miler 氏 判定 的 质数 ， 事实 就 
是 非 质数 了 。 

所 以 自然 就 有 人 试 着 把 这 些 或 然 的 性 质 ， 或 上 面 方法 中 与 
假说 相连 的 缺陷 从 方法 中 除去 。 果 然 在 1980 年 三 个 美国 数学 家 
L.Adleman 〈 南 加 大 )，R .Rumley 及 C.Pomernance (伊里 诺 大 
学 ) 得 到 了 一 个 相当 快 而 且 具 果断 性 的 检验 法 。 他 们 的 方法 可 
以 正确 地 判断 一 个 数 为 质数 或 非 质数 ， 但 其 缺陷 是 计算 速度 不 
够 快 《 超 过 多 项 式 时 间 )， 仍 无 法 改进 到 多 项 式 的 时 间 。 

最 新 的 一 个 方法 是 由 麻 省 理工 学 院 的 两 位 数学 家 Goldwas- 
ser 及 Kilian 的 或 然 性 检验 法 (这 里 的 或 然 性 与 前 面 提 的 或 然 性 
两 者 意义 上 不 同 )， 这 个 方法 很 快 ( 只 需 多 项 式 时 间 ) 就 可 以 把 
一 个 非 质 数 的 数 正 确 地 判定 出 来 ， 对 于 质数 也 可 以 作 正 确 地 判 
断 ， 但 其 理论 上 就 是 可 能 对 一 小 部 分 《比例 上 而 言 ) 的 质数 ， 
这 个 方法 判断 的 时 间 不 很 快 〈 即 超过 多 项 式 时 间 ), 也 就 是 因为 
有 这 样 一 个 可 能 很 小 的 机 会 ， 运 算 时 间 较 长 ， 所 以 仍 把 这 个 方 
法 归 之 于 或 然 性 的 检验 法 。 但 有 趣 的 是 迄今 为 止 还 未 有 人 找 出 
一 个 需要 超过 多 项 式 时 间 来 判断 的 质数 例子 ! 而 且 如 果真 的 找 
出 如 些 一 个 质数 ， 将 会 袁 动 数学 界 ， 因 为 这 与 数论 上 一 个 有 关 
质数 分 布 密度 的 有 名 的 猜测 有 关 。 

在 K-G 两 氏 的 方法 及 其 它 一 些 类 似 的 方法 中 ， 主 要 与 研究 
所 谓 的 炳 圆 曲线 上 的 整数 点 及 其 阶 (rank)7 的 高 深 研究 有 关 ， 而 
这 方面 的 研究 ， 原 来 是 与 解决 讨论 下 列 的 一 个 问题 有 关 ， 

设 PCx， 力 为 Z,y 的 一 个 齐 次 多 项 式 (如 pC2,y) =2? 一 3 太 7 
m 为 任 一 整数 ， 以 NsCm) 表 满足 方程 式 
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的 所 有 整数 解 的 个 数 ， 


我 们 已 知 的 是 N,Cm) 总 为 有 限 的 《其 值 当 与 p 及 mw 有 关 ), 但 


如 何 求 出 那些 整数 解 及 精确 判断 N;,Cm) 的 界限 ! 这 些 一 直 都 是 
数论 中 漂亮 而 且 驱 深 的 研究 课题 。 
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第 四 章 ”未 来 数学 家 的 挑战 一 计算 量 


吓 


81 前 


有 数学 家 说 过 “一 个 好 的 问题 胜 过 十 个 好 解答 ,因为 解答 
一 出 ， 此 问题 已 是 到 了 终点 ， 对 不 断 求 创 新 的 人 们 而 言 ， 已 不 
构成 挑战 。 而 新 的 问题 是 源头 活水 ， 能 开拓 新 的 境界 。 多 数 人 
都 不 愿 沉 醇 在 好 的 解答 中 不 断 的 玩味 ， 而 希望 找到 新 的 问题 ， 
不 断 的 思考 、 摸 索 。 

大 家 在 < 数学 传播 ?上 已 看 见 了 不 少 好 的 问题 ， 尤 其 最 近 康 
明 昌 教授 谈 到 的 费 马 定理 ， 几 何 三 大 难题 ,都 是 极 有 趣 的 问题 。 
有 的 已 有 了 解答 ， 有 的 尚 待 解决 。 除 了 上 面 的 题目 外 ， 像 四 色 
问题 ( 即 任 何 一 个 地 图 只 要 用 四 种 颜色 就 可 以 把 国界 分 开 )， 五 
次 以 上 方程 式 的 公式 解 ， 及 数论 上 质数 分 布 问题 ， 都 曾 在 职业 
及 业余 数学 家 的 心目 中 占有 相当 的 地 位 。 本 文 所 要 介绍 的 是 一 
个 最 近 (1970 年 开始 ) 一 种 许多 数学 家 及 电子 计算 机 学 家 所 关心 
的 大 问题 一 一 NP 问题 .NP 所 代表 的 意思 , 你 看 完 本 文 之 后 自然 
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员 \ 


会 明白 ， 现 在 你 不 妨 记 住 ‘NP-hard” 这 个 伟大 的 字 。 将 来 如 果 
你 对 某 人 说 你 的 问题 是 “NP-hard”， 他 也 许 就 要 对 你 刮目相看 
了 ，NP-hard 不 但 表示 hard( 难 )， 而 且 是 NP 的 难 ! 

NB 问题 的 代表 问题 之 一 是 售货员 旅行 问题 (raveiing sales- 
man probjem)。 有 一 个 省 货 员 要 开 汽 车 到 个 指定 的 城市 去 推 
销 货物 , 他 必须 经 过 全 部 的 n 个 城 。 现 在 他 有 一 个 有 此 n 城 的 地 
图 及 各 城 之 间 的 公路 距离 ， 试 问 他 应 如 何 取景 短 的 行程 从 家 中 
出 发 再 回 到 家 中 ? 


-em A 
40 
三 35 
NO 
40 
本 分 30 
D 40 C 
图 7 售货员 行走 的 地 图 4， 娓 ，C，… 表 城市 ， 数 字 表 两 城 之 间 的 里 数 
如 图 7 中 ， 4， B, C， “°°, G 表 示 7 个 城市 ， 而 售货员 要 从 
4 城 出 发 再 回 到 4 城 并 访问 B，C，…G 所 有 的 城 ,一 个 可 行 的 方 
法 是 


A—>B—>C—G->D->E—>F—A 


问题 是 ， 这 是 否 是 最 短 的 途径 ? 也 许 
A—G—B—C—» D>F— >E->A 


蝎 近 呢 ? 加 起 来 的 结果 第 一 路 径 总 长 235 里 ,而 第 二 路 径 总 长 为 
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230 里 ， 故 第 二 路 径 较 短 ， 但 是 否 存 在 一 个 更 短 的 路 径 呢 ?目前 
的 方法 接近 一 个 一 个 的 排 着 试 ， 还 没有 找到 更 好 可 以 寻 得 最 短 
路 径 的 方法 。 对 七 个 城 而 言 ， 共 有 61= 720 个 排 法 ， 尚 不 算 难 ， 
但 车 有 20 个 城 ， 则 排 法 就 有 19!1 种 。 因 

n1T 92am (nfe)" 
故 191 守 1.21 X10!7 
在 排列 组 合 里 #!1 写 起 来 轻松 ， 但 1.21x 10 呈 是 一 个 大 得 不 得 了 
的 数字 ， 壤 每 秒 钟 排 一 次 ， 要 排 3.84x 10* 年 (一 年 约 为 3.15 x 
107 秒 )， 即 使 使 用 计算 机 ， 每 秒 排 一 百 万 次 (不 容易 做 到 ) 也 
得 重 做 三 千年 才能 找到 管 案 .“ 生 也 有 涯 ， 知 也 无 洗 ?， 想 不 到 
区 区 二 十 个 城 ， 要 三 十 个 世纪 才能 找到 答案 。 

由 于 电子 计算 机 的 发 展 ， 有 许多 以 前 认为 枉 费时 的 计算 ， 
像 行 列 式 之 值 . 反 和 矩阵、 高 次 方程 式 的 解 ， 都 可 以 在 极 短 的 时 间 
内 解决 。 但 也 突然 出 现 了 一 些 新 间 题 ， 连 大 型 计算 机 也 望 之 兴 
叹 。 像 售货员 问题 ， 因 为 找 不 到 比 硬 排 好 得 很 多 的 做 法 ， 使 得 
数学 家 们 开始 想 要 证 明 ， 根 本 找 不 到 比 硬 排 好 得 很 多 的 做 法 ， 
这 个 证 明 至 今 尚未 找到 ， 就 像 以 前 一 角 三 等 分 问题 一 样 ， 既 然 
找 了 岂 千 年 找 不 到 用 圆规 直 尺 三 等 分 任 一 角 的 方法 ， 也 许 我 们 
可 以 证 明 绝 对 不 可 能 用 圆规 直 尺 三 等 分 一 角 。 现 在 我 们 要 证 明 
绝 不 可 能 写 一 个 计算 机 程式 大 大 的 简化 逢 货 员 旅 行 问题 ， 与 三 
等 分 一 角 问 题 不 同 的 是 ， 前 者 是 一 种 数学 上 的 好 奇 ， 而 当今 的 
问题 与 实际 用 途 却 有 密切 的 关联 。 

在 此 我 们 一 直 强 调 一 个 好 得 很 多 的 方法 ， 原 因 是 对 这 类 的 
问题 ， 你 若 能 计算 快 一 售 或 十 倍 、 千 倍 ， 往 往 起 不 了 什么 大 作 
用 ， 好 像 列 才 的 二 十 城 旅行 问题 ， 即 使 快 了 十 傍 ， 仍 需 三 年 的 
计算 时 间 ， 而 再 加 三 城 立刻 就 把 这 个 计算 法 的 效果 抵消 了 ， 因 
此 我 们 所 要 的 是 计算 量 基本 层次 的 减少 ， 这 就 是 我 们 在 下 一 节 
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所 要 讨论 的 。 


82 计算 量 


计算 量 ， 顾 名 思 义 ， 是 指 解 决 某 问 题 所 需要 计算 的 时 间 ， 
但 因 每 个 复杂 问题 的 计算 往往 都 要 经 过 许多 不 同 的 运算 ， 除 加 
减 乘除 四 则 外 ， 还 要 包含 比较 、 取 数据 、 存 数据 等 等 ， 若 仔细 
计算 起 来 ， 十 分 困难 ， 一 般 都 只 绘 出 一 两 个 主要 的 量 ， 加 以 统 
计 ， 以 上 节 中 售货员 旅行 问题 为 例 ， 其 主要 的 工作 是 对 每 一 个 
排 法 加 起 总 路 径 之 长 ， 因 对 # 城 而 言 ， 有 (=- 1)1! 的 排 法 ， 我 们 
就 定 其 计算 量 为 O(n1)， 即 在 n! 之 层次 (order 即 O 缩 写 之 来 源 》 
之 内 ， 

举 二 个 例子 ， 我 们 若 要 求 n 个 数 的 和 或 平均 值 ， 则 其 计算 
量 为 0Cn) ,但 若 我 们 要 把 4 个 数字 依次 排列 , 则 其 计算 量 会 因 做 
法 的 不 同 而 有 相当 的 差别 ， 一 个 直接 了 当 的 方法 是 ， 先 求 出 最 
大 的 ( 比 (a 一 1) 次 )， 再 从 不 是 最 大 的 中 间 求 次 大 的 ( 比 (n 一 2) 
次 )， 再 求 第 三 大 的 ( 比 人 2 - 3) 次 ) ，… 如 此 一 共 比 了 

GD+COT2 TH+1 
次 就 可 以 完成 此 工作 。 因 此 我 们 以 O(n*)， 即 在 nn: 之 层次 来 天 
此 方法 的 计算 量 。 另 外 一 种 快 排 法 ， 先 把 4 个 数 分 成 若干 小 块 ， 
每 块 排 好 之 后 再 合 起 来 ， 则 可 以 证 明 此 种 方法 之 计算 量 为 OCn 
log,n)‘!，。 因 排 数 字 与 排名 字 、 电 话 号 码 相同 ,这 种 排 法 很 有 
实用 价值 ， 例 如 某 大 城 有 一 百 万 户 ， 则 hn? = 10;， 而 wl0g2n 只 
有 2x107， 其 差别 三 个 月 与 一 分 钟 之 比 。 
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表 1 以 计算 宙 每 秒 做 一 百 万 次 时 完成 各 层次 计算 量 记 约 需 的 时 间 
(车 无 单位 ， 均 以 秒 为 单位 ) 
n logn n nloen nn? mn3 27 37 ni 


| 
10 1075 110-5 | 105 1 1074 0.059 ，0.45 
20 10 1105|110 5 | 104| 102? ”1( 黎 )， 58( 分 ) ， 1 年 
50 10-5 | 10-4 | 10-4 0.0025| 0.125 | 36 年 2 x 101 0 年 ， 105 "年 


| 


1000 10-5 | 10°8 10- | 1 16 小 时 | 1 和 板 大 
108 10-5 1 6 1 月 : 105 年 极 大 
109 10-5 |16 小 时 | 6 天 | 3 年 |3x109 千 极 大 
一 般 计 算 量 的 层次 多 以 下 表 来 区 分 ，. 
O(logn) <OCn) <Olnlogn) <OCn’) OG) 
<O(2') <OCR")<OCn!) 


在 上 表 中 ，& 为 某 一 大 于 2 的 正 整数 ， 它 们 中 间 都 有 一 道 鸿沟 ， 
有 基本 层次 的 不 同 ， 在 计算 机 理论 上 ， 若 某 人 能 发 现 一 个 新 的 
方法 ， 降 低 一 个 层次 的 计算 量 ， 那 么 他 的 新 方法 有 资格 称 之 为 
一 个 突破 ， 可 以 不 朽 臭 。 表 1 有 一 个 对 上 项 各 量 的 比较 ,是 以 计 
算 机 每 秒 作 一 百 万 次 (10°) 计 算 为 原则 . 

在 这 个 表 中 ， 特 别 注意 m3 与 2" 中 之 差异 ， 一般 称 2" 为 计算 
量 呈 指数 上 升 ， 而 % 或 赤 之 计算 量 呈 # 的 方 次 上 升 '“*，， 对 目前 
及 未 来 的 计算 机 而 言 ， 一 个 呈 方 次 上 升 的 计算 量 应 可 以 应 付 ， 
但 对 一 个 呈 指 数 上 升 的 计算 量 在 * 相 当 大 时 则 毫 无 希望 .因此 计 
算 机 学 家 所 集中 精力 的 方向 在 如 何 将 一 个 呈 指 数 上 升 的 计算 量 
问题 ， 简 化 成 一 个 方 次 上 升 的 计算 量 问 题 ， 我 们 对 定义 凡 对 一 
个 问题 中 最 重要 的 参数 1 而 言 ,车 能 找到 一 个 方法 可 以 以 方 次 上 
升 的 计算 量 完成 ， 我 们 称 此 问题 为 一 P- 问 题 (P 为 英文 多 项 式 
Polynomial 之 第 一 字母 ), 包含 所 有 此 问题 之 集合 以 P 表 示 之 ， 
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$3 P 之 外 ? 


本 节 的 题目 有 点 不 平常 ， 我 们 的 目的 是 提醒 读者 本 文中 常 
用 的 英文 大 写 的 P 是 一 个 凡 能 用 OCn*) 计算 量 解 决 的 问题 的 集 
合 。 而 了 之 外 加 一 个 间 号 系 指 到 目前 为 止 ,我 们 尚 不 知道 P 之 外 
是 否 是 一 个 空 集合 .。 

到 目前 为 止 ， 除 了 售货员 旅行 问题 之 外 ， 已 经 有 上 百 有 趣 
或 有 用 的 问题 ， 无 法 用 O(m? 的 计算 量 来 解决 ,我 们 在 此 列举 几 
个 例子 ， 

问题 1， 和 售货员 旅行 问题 ( 甲 )， 即 第 一 节 所 述 的 问题 ,不 青 
重复 ， 不 过 假定 所 有 距离 均 为 正 整数 '*’。 

问题 7， 售货员 旅行 问题 ( 乙 ), 与 第 一 题 的 条 件 相同 ， 但 现 
在 有 一 个 给 定 的 正 整数 3， 问 题 是 是 否 存在 一 条 路 径 其 总 距 离 
不 大 于 8. 〈 问 题 1 与 问题 2 在 表面 上 相似 ， 但 在 以 后 的 理论 上 有 
很 大 的 不 同 ,) 

问题 3， 背 袋 问题 ( 甲 )， 有 物体 n 个 ， 各 重 WisW，，*…，W， 
今 欲 将 它们 分 为 二 袋 ,试问 如 何 分 法 可 使 两 袋 的 重量 最 为 接近 ， 
《不 妨 假 定 w; 皆 为 正 整 数 ， 这 并 未 失去 一 般 性 ,) 

问题 4， 背 袋 问题 ( 乙 ), 如 上 题 ， 并 给 定 一 正 整 数 B， 试 问 
可 否 选 出 若干 W%， 使 其 和 


S<> Ww/2 且 S>B 
fl 


问题 5， 包 装 问题 ， 有 + 个 各 别 重量 小 于 1 公斤 的 物品 及 足 
够 可 以 装 1 公斤 东西 的 盒子 ， 今 将 物品 装 于 盒子 之 中 ,各 个 物品 
可 装 于 一 盒 ， 但 任何 一 盒 不 得 重 于 1 公斤 ， 试 求 最 小 的 盒子 数 ， 
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问题 6， 舞 伴 问 题 ， 今 有 "个 男孩 子 与 x 个 女孩 于 参加 人 舞会 ， 
每 个 男孩 与 女孩 均 交 给 主持 一 个 名 单 ， 写 上 他 (她 ) 中 意 的 甸 伴 
(至少 一 人 ， 但 可 以 多 于 一 人 )。 试问 主持 人 在 收 到 名 单 后 ， 是 
否 可 以 分 成 ?对 ， 使 每 人 均 得 到 他 (她 ) 所 喜欢 的 舞伴 。 

问题 7， 库 存 问题 ， 某 仓库 有 D 个 存 仓 ， 排 成 一 列 ， 今 有 ? 
批 货物 ， 各 可 占有 一 个 或 多 个 存 仓 ， 并 已 知 各 批 物品 存 入 与 提 
出 的 日 期 .试问 可 否 将 各 货物 存 入 库 里 不 发 生存 仓 不 够 的 困难 
且 同 一 批 货物 车 需 一 个 以 上 存 仓 时 ， 其 存 仓 必须 相 邻 ， 

问题 8， 已 知 a2，6，# 三 正 整数 , 问 是 否 存在 一 小 于 w 位 之 正 
整数 z， 使 得 

rz: 三 a(mod b) 

问题 9,，〈 甲 )， 给 定 一 2# 位 正 整 数 c， 试 问 其 是 否 为 质数 ? 

( 乙 ): 给 定 一 ?* 位 正 整 数 s， 试 问 是 否 存在 m，?#>>1 目 4= 
mn? 

问题 10， 分 从 问题 ， 已 知 空间 "个 点 ,并 假定 各 点 之 间 的 距 
离 为 正 整 数 ， 又 给 定 两 正 整数 K 与 B， 问 是 否 可 将 此 点 分 成 小 
于 K 个 不 重合 的 子 集 ， 使 得 在 同一 子 集 内 的 任意 二 点 距离 均 不 
大 于 B? 

现在 可 以 看 出 这 类 问题 的 一 般 结构 了 。 很 显然 的 ， 有 些 是 
极 有 用 的 问题 ,而 有 些 可 以 转换 成 有 用 的 问题 ， 例 如 有 舞伴 问题 ， 
若 把 男孩 与 女孩 换 成 工人 与 工头 ， 或 医生 与 病人 就 有 大 用 了 。 
这 些 问题 到 目前 没有 一 个 可 以 证 明 是 属于 P 的 ,大 家 都 猜测 它们 
可 能 在 P 之 外 ， 即 其 计算 量 是 呈 指 数 增加 的 。 

在 60 年 代 ， 已 有 些 人 把 某 些 问题 归于 一 类 了 ， 即 是 几 个 问 
题 是 互 依 的 ， 车 其 中 之 一 属于 P， 则 其 它 几 个 也 属于 P, 其 证 明 
方法 大 都 是 证 明 两 个 互 依 问题 中 间 有 一 个 只 需要 用 O(z* 时 间 
来 完成 的 桥梁 。 直 到 1971 年 古 克 (Stephen A. Cook) 发 表 了 
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“The Complexity of Theorem Proving Procedures” 才 把 P 之 
外 的 问题 归 成 了 三 大 类 ， 即 NP，NP-complete 及 NP-hard'4)， 
现在 谈 古 克 定律 。 


$4 古 克 定律 与 NP-completeness 


十 克 定 律 的 证 明 很 难 ， 就 是 了 解 它 也 不 容易 ， 我 们 将 从 几 
个 角度 来 看 这 个 问题 ， 试 着 去 了 解 它 。 它 的 主要 结果 是 把 前 节 
那 类 问题 大 都 归于 一 个 较 易 证 明 的 集合 ， 称 之 为 NP， 而 在 NP 
中 找到 一 批 互 依 的 问题 称 之 为 NP-complete 类 并 得 到 下 面 的 结 
果 . 

1. 车 有 一 个 NP-complete 问 题 可 以 用 O(n*) 计 算 量 来 解决 ， 
则 全 体 的 NP 问题 都 可 以 用 OCn*) 的 计算 量 来 解决 ， 即 

1 若 有 一 个 zxENP-complete 日 zxEP， 则 P=NP。 

又 换 句 话说 ，NP-complete 是 NP 中 的 难题 ，NP-complete 
解决 了 ，NP 就 解决 了 . 但 车 有 一 个 属于 NP 而 不 属于 NP- 
complete 的 问题 解决 了 ， 则 其 它 的 NP 问题 不 一 定 可 以 解决 ， 

什么 叫做 NPY NP 是 英文 nondeterministic polynomial 的 
缩写 ， 意 思 就 是 非 确定 性 的 多 项 式 。 要 了 解 这 个 字 ， 我 们 先 看 
一 看 普通 计算 机 的 作用 。 

现在 已 知 用 一 个 计算 机 ,要 解决 售货员 旅行 问题 非常 困难 ， 
但 车 我 们 有 许多 计算 机 同时 用 ,是 否 可 以 快 到 把 原 问题 在 OCm*) 
时 间 内 解决 ?“ 许 多 "， 不 是 一 、 二 ， 多 一 二 个 是 于 事 无 补 的 ， 
多 百 个 千 个 仍 是 杯水车薪 ， 不 能 有 很 大 的 作用 ， 因 为 就 是 一 千 
个 机 子 可 以 分 开 做 ， 也 最 多 只 能 快 一 千 倍 ,在 第 一 节 内 已 说 过 ， 
帮助 不 大 ， 因 此 计算 机 学 家 先 放眼 望 去 ， 干 脆 人 允许 你 可 以 无 限 
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的 增加 机 器 。 现 在 我 们 要 注意 的 是 并 不 是 有 了 无 限 多 的 机 器 ， 
记 有 的 问题 就 可 以 立刻 解决 了 ， 因 有 的 问题 有 先后 次 序 ， 例 如 
在 算 下 式 的 时 候 
[Ca +G,)as +asjas+ase 

除非 换个 形式 ， 否 则 必须 一 步 一 步 的 解 括 绝 ， 机 子 多 了 并 不 能 
加 快 计算 的 速度 ， 而 且 机 子 多 了 ， 其 间 的 联络 千变万化 ， 一 个 
机 子 要 应 付 千 千 万 万 别 的 机 子 送 来 的 信号 也 疲于奔命 了 。 因 此 
我 们 只 假定 所 有 的 机 子 都 只 承上启下 ， 单 线 作 业 ， 不 作 任何 横 
向 联络 ， 也 就 是 说 ， 机 器 1 可 以 把 它 的 结果 传 给 它 下 面 的 机 
子 ， 像 9，a:，…，q 而 每 一 个 机 子 又 可 以 把 它们 的 结果 传 
给 自己 的 子 机 ， 但 在 41;，4,，…，a,, 之 间 不 互相 联络 。 以 此 
货 员 旅行 问题 为 例 ， 若 有 20 个 城 ， 第 一 个 机 子 开始 ， 叫 下 面 19 
个 机 子 各 取 一 个 不 同 的 城 及 计算 与 4 距离 ， 而 这 个 19 个 机 子 又 
将 它 所 求 得 的 距离 交 给 自己 的 18 个 子 机 ， 令 它们 取 一 个 与 自己 
不 同 的 城 加 上 距离 ， 如 此 往 下 ， 在 第 十 次 时 ， 第 十 阶段 的 机 子 
把 它 已 取 9 城 及 总 距离 告诉 下 一 个 机 子 , 叫 它们 再 取 一 与 已 取 之 
城 不 同 之 城 加 上 距离 ， 如 此 一 直 做 到 第 19 次 ， 所 有 路 线 的 距离 
都 有 了 ， 在 时 间 上 求 得 所 有 的 距离 是 OCw) 〈 但 用 了 19! 个 计算 
机 )， 古 克 定 义 可 以 在 O(n 仆 时 间 内 用 无 限 多 计算 机 解决 的 问题 
为 一 NP 问题 ， 

现在 要 记 住 的 是 由 于 无 横向 连 络 ， 在 所 有 路 径 的 距离 都 有 
了 之 后 ， 并 没有 解决 售货员 问题 ( 甲 )， 因 为 不 知 谁 是 最 短 ( 若 
加 以 比较 以 求 最 短 距离 ， 则 要 O(n1) 个 比较 )， 因 此 我 们 不 能 说 
售货员 旅行 问题 ( 甲 ) 是 一 个 NP 问题 。 但 上 节 问 题 2， 和 售货员 旅 
行 问题 ( 乙 )， 任 何 一 个 单线 都 可 以 知道 它 的 总 距离 是 否 不 大 于 
B， 因 此 每 单线 都 有 一 个 “Yes” 或 “No” 的 答案 。 只 要 有 一 个 
“Yes "的 答案 ， 我 们 即 知 道 本 问题 已 解决 ， 故 问题 二 是 一 个 NP 
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问题 。 在 单线 作业 中 ， 每 个 机 子 可 以 作 三 件 事 。 

1 .目前 答案 不 明确 ， 大 家 各 自作 业 。 

2. 某 线 已 找到 答案 ， 立 刻 叫 停 ， 大 家 停止 作业 , 解 题 完毕 。 

3. 此 咯 不 通 ， 本 线 不 再 作业 ,但 不 叫 停 , 别 的 线 仍然 作业 ， 

从 上 项 作用 ， 很 容易 看 出 找 出 答案 的 计算 时 间 即 某 线 叫 停 
的 时 间 ， 亦 即 任何 一 个 有 “Yes” 答 案 线 中 计算 量 之 总 和 ,也 就 是 
说 找到 答案 “捷径 ”上 所 需 的 时 间 。 说 得 更 明白 一 些 ， 在 一 非 
确定 性 计算 机 系统 下 ， 其 子 机 像 有 “猜测 ”到 捷径 的 功能 ， 若 
在 任何 计算 步骤 中 ， 某 人 猜 了 一 个 答案 ,而 计算 机 可 以 在 OCe7 
时 间 内 回答 “Yes” 或 “No”， 这 个 问题 即 是 一 个 NP 间 题 。 再 以 
售货员 旅行 ( 甲 ) 及 图 7 为 例 ， 若 你 猜 一 个 路 径 

A—B-—>C->D->E->F->G—>A 
我 们 无 法 知道 此 路 是 否 最 短 ， 但 在 (8) 问题 中 ， 一 个 “Yes” 或 
“No" 的 结果 只 要 7 个 加 法 就 可 以 回答 了 , 因此 根据 新 的 定义 , 问 
题 2 是 一 个 NP 问 题 。 

由 这 两 个 定义 ， 读 者 不 难看 出 问题 2，4，6，7，8，9( 乙 ) 
与 10 篆 为 NP 问题 ， 特 别 是 问题 9 的 ( 甲 )、( 乙 )， 其 实 是 一 样 的 
问题 ， 但 如 果 你 猜 二 个 m，Hn， 立 刻 就 可 知道 6 是 否 是 mn。 

古 克 定理 的 关键 在 证 明 若 一 种 叫 满足 问题 (Satisfiability 
Problem) 的 例子 属于 P， 则 所 有 NP 问题 均 属于 P〈 即 此 问题 属 
于 NP-complete)， 令 。,+,， ~ (上 且 ， 或 ， 反 ) 表 三 个 基本 的 退 
辑 运 算 《 即 对 0 与 1 逻辑 符号 而 谋 ,0 二 1，1=0， 除 了 1+1=1 之 
外 , + "与 一 般 代数 之 加 乘 相 同 )。 令 /为 一 个 含有 * 个 逻辑 变数 
CW，UWs，，…，U,) 的 函数 。 假 如 我 们 可 以 找到 一 组 wi ,Ws，…， 
W,， 使 得 (Uw,，…，W) 二 1， 则 f (Ww1，Ws， ,Ws) 称 为 可 
满足 。 例 如 


fu, Ws, Us) 一 CUI B+) Ms + Us)* Us (1) 
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为 一 可 满足 函数 ， 取 4 二 WW, = 一 4s 一 I 即 可 ， 但 
fu Was 1L3s) 一 ( 1 tu Ru 二 十 Ha》 (2) 

永 为 0， 故 此 /为 不 可 满足 。 

直 沉 上， 这 类 问题 除了 将 4 ，us ur 一 个 一 个 以 0，1 代 
入 检查 2" 次 之 外 ， 显 无 捷径 可 循 ， 古 克 1971 年 的 论文 即 证 明 这 
是 一 切 NP 问 题 之 母 。 

古 克 定 理 ， 满 足 问题 为 NP-complete。 

现在 已 可 证 明 在 前 节 中 的 问题 ， 除 了 问题 1，3,5,9 之 外 ， 
全 是 NP-ecomplate 问 题 。 


§5 ”NP 问题 之 近似 解 


NP 问题 既 找 不 到 可 行 的 解法 ， 而 很 大 部 分 的 NP 问题 都 在 
计算 机 语言 、 程 式 、 电 路 设计 、 统 计 学 、 程 式 作 业 上 有 大 用 ， 
因此 只 好 退 而 求 其 次 找 一 个 可 行 的 近似 解 。 很 可 惜 的 是 ， 所 有 
的 NP-complete 问 题 虽 在 NP 的 层次 上 相 联 ， 在 近似 解 上 往往 各 
需 不 同 的 解法 ， 这 些 解法 多 从 直观 而 来 ,我 们 在 此 举 二 个 例子 。 

例 1 在 第 三 节 问 题 5， 包 装 问题 中 ， 若 采取 “能 装 就 装 ” 
法 ， 即 现 有 的 盒子 若 可 以 装 得 下 ， 就 不 用 新 盒子 ， 则 此 法 所 需 
用 之 盒子 数 k1 与 最 可 能 少 的 盒子 数 k。 满 足 &, <<2ko + 1， 

证 明 ， 今 令 # 个 物品 之 重 为 W:，Ws,，…，ws 公 斤 ， 因 每 个 
盒子 只 可 以 装 1 公斤 ， 故 


ko> YW 
i=¥ 


另 一 方面 “能 装 就 装 ”法 不 可 能 有 两 个 以 上 的 盒子 同时 少 
于 1/2 公 斤 ， 故 
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Ai <<2y wt+l 
i=1 


本 例 得 证 . 

这 个 问题 的 结果 是 说 ， 我 们 大 约 可 以 用 “能 装 就 装 ” 法 做 
得 最 好 情形 的 一 半 好 。 经 过 较 复杂 的 证 明 ，Johnson 在 1974 年 
证 得 ， 当 4 很 大 时 ， 


(1) kh < rho + 2 且 存 在 一 种 情形 能 产生 。 


(2) h, > (ho -1), 


也 就 是 用 “能 装 就 装 ” 法 不 会 坏 到 70% 以 上 ， 但 可 以 坏 到 多 用 了 
70% 的 盒子 ， 

例 2 售货员 旅行 问题 的 一 个 直观 走 法 是 先 访问 那个 尚 来 
访问 过 最 近 的 城 ， 称 为 “ 先 访 近 城 ? 法 ， 以 图 7 为 例 ， 其 走 法 为 

A—G—C—»B-—>D->F->E—»A 

Rosenkrantz 等 在 1977 年 证 明 这 并 不 是 一 个 很 理想 的 走 法 ， 
他 们 证 出 车 名城 间 的 距离 满足 三 角 不 等 式 ,‘" 则 “ 先 访 近 城 ” 
法 所 走 之 总 程 D1 与 最 短路 径 D。 之 关系 为 


D, <3( [log:%]+1 )D, 


且 当 sn 很 大 时 ， 可 以 有 一 种 情形 使 得 
1 4 
D, > 3 (ln+ 3)D 


上 式 中 之 Lz] 表示 大 于 7 之 最 小 整数 ， 假 如 [5]=5，[2.5]=3。 
因 log;*x 当 # 大 时 可 以 很 大 ， 故 Di 可 与 De 相差 非常 之 大 ， 但 在 同 
一 篇 论文 之 中 ，Rosenkrantz 等 证 明 另 一 种 复杂 的 “直观 ” 走 法 
可 以 达到 D, 科 2D。 的 地 步 。 
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在 上 面 的 定理 中 ， 三 角 不 等 式 的 条 件 很 重要 ， 若 城 之 距 离 
无 此 关系 存在 时 ，Sahni 与 Gonzalez 在 1976 年 证 得 ， 若 Ps: NP， 
则 不 可 能 存在 一 个 有 限 的 m， 及 一 个 OCn' 计算 量 的 走 法 ， 能 
使 其 全 程 长 D, 在 任何 4 时 满足 
D, <mD, 
即 上 式 中 m 非 等 于 无 限 大 不 可 ， 亦 即 所 有 OCn) 的 做 法 都 不 很 
好 。 


§6 NP-hardness 与 围棋 


不 是 所 有 的 难题 都 可 归结 为 NP 问题 , 像 下 得 一 手 绝对 好 的 
围棋 现在 目前 的 推测 是 比 记 有 NP 问题 还 要 难 的 计算 问题 ， 即 
NP-hard 问 题 ，NP-hard 问 题 的 定义 如 下 ， 

若 7 为 一 NP-hard 问 题 ， 则 若 

NPxP, 则 XP 

也 就 是 说 ， 即 使 P=NP，z 还 不 一 定 属 于 P， 但 P<NP， 则 7z 绝 
不 比 NP 的 问题 容易 。 在 第 三 节 中 的 问题 1.3 不 一 定 是 NP 问题 ， 
但 车 能 以 OCm) 的 计算 量 解 决 它们 ， 则 比较 容易 的 问题 2 与 4 
也 可 以 OCn 外 解决 , 故 车 问题 1!，3 EP， 则 问题 2，4EP， 又 因 2， 
4 是 NP-complete， 即 推出 NP=P。 这 与 NP-~hard 之 定义 相合 , 故 
问题 1，3 均 为 NP-hard 问 题 ， 同 理 问 题 5 也 属于 NP-hard， 不 过 
这 些 NP-hard 似乎 比 NP 难 不 了 多 少 ， 但 下 棋 问 题 可 能 比 NE 问 
题 要 难得 多 ， 围 棋 问 题 可 以 作 如 下 叙述 。 

问题 11:， (围棋 问题 ) 以 平常 的 围棋 规则 在 一 个 wx ?的 模 
盘 上 下 ， 给 定 一 个 残局 (下 了 二 个 子 就 可 以 算 残 局 )， 黑 先 ， 是 
否 可 以 确定 黑子 在 最 好 的 下 法 之 下 ， 一 定 会 赢 ? 
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这 个 问题 不 能 用 一 般 的 方法 证 明 它 是 不 是 为 NP， 因 为 目 
前 没有 人 能 猜 一 个 必 胜 的 下 法 且 在 O(*7 时 内 证 明 它 是 对 的 , 因 
为 它 与 对 方 如 何 应 付 有 关 ， 而 敌 方 的 应 付 又 与 他 对 你 以 后 的 下 
法 的 推测 有 关 ， 如 此 往 下 走 ， 首 先 发 生 困难 的 是 记忆 上 亮 了 红 
灯 ， 即 所 需要 的 记忆 可 能 星 方 次 以 上 的 进展 ， 

因 每 一 个 记忆 至 少 要 用 (来 计算 一次， 否则 这 个 记忆 就 不 
如 不 要 ， 因 此 一 个 问题 的 记忆 车 呈 指 数 上 升 ， 则 其 计算 量 亦 非 
旦 指数 似 的 上 升 不 可 . 

因此 计算 机 学 家 定义 三 个 新 的 集合 : 


PSPACE = {7:7 只 需要 方 次 上 升 的 记忆 ) 
PSPACE-complete; 


若 xzEPSPACE, 
又 TEPSPACE -complete 
且 ZEP， 
则 P=PSPACE., 
PSPACE ~ hard, 
若 zEPSPACE -hald 
且 zxzEP 
则 P=PSPACE 
注意 在 上 式 中 PSPACE - completeCPSPACE， 即 PSPACE -~ 
complete 是 PSPACE 中 的 难题 ， 但 PSPACE -- hard 不 一 定 属于 
PSPACE，Stockmeyer and Meyer 在 1973 年 证 明了 一 个 与 古 克 
相似 的 定理 。 

若 令 3z 表 示 存 在 一 个 2%，Yz 表 对 所 有 的 z，Q& 表 3、Y 中 的 
一 个 ，z 为 布 氏 变数 0 与 1， 则 我 们 称 f(@171，Q272，…' ,Onn) 
为 一 量化 布 氏 公式 ， 若 /有 可 能 为 1， 则 / 称 之 为 可 满足 ， 例 如 
把 第 四 节 中 之 (1) 式 改写 成 
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f(Yu, Ius, Vus) 
=((VU) Yu + Hu) AU + Vu) CY Us)) 
则 上 式 不 可 能 满足 ， 因 对 YUsCts 为 0 或 1) 而 言 ，j 不 全 是 1， 
Stockmeyer 与 Meyer 之 定理 为 
定理 ”检定 一 个 量化 布 氏 公式 为 可 满足 是 一 个 PSPACE ~ 
complete 问题 。 
当 我 们 下 棋 面 对 着 一 盘 残局 沉思 的 时 候 ， 我 们 要 求 是 
对 我 是 否 看 在 一 着 必 胜 棋 可 以 对 付 
敌人 任何 一 着 应 付 棋 
此 后 我 是 否 存在 一 着 必 胜 禄 可 以 对 付 
敌人 任何 一 着 应 付 棋 
我 是 否 存在 一 着 必 胜 棋 可 以 对 付 
敌人 任何 一 着 棋 
我 赢 了 


因此 这 完全 是 习 ，Y， 习 ，Y，… 之 交替 作用 与 Stockmeyer 与 
Meyer 定 理 之 关系 至 为 密切 ，Robertson 与 Munro 在 1978 年 证 
得 围棋 是 一 种 PSPACE-hard 的 问题 ， 目 前 有 人 计算 到 围棋 5” 
必 胜 法 的 记忆 计算 量 在 10"" 以上， 不 论 人 脑 或 电脑 的 记忆 缀 
少不了 一 个 原子 ， 而 现今 所 知 的 字 宙 原子 数 约 只 有 10 7 个。 棋 
之 道 ， 大 矣 哉 ! 要 做 一 个 下 围棋 必 胜 的 机 器 人 谈何容易 ! 


87 结 论 
现在 你 明白 20 世 纪 的 大 难题 了 ，P=NP? 用 简单 的 语言 


说 ,就 是 是 否 能 找到 一 个 只 呈 方 次 增加 的 计算 方法 去 解决 旅行 、 
，70 。 


包装 、 有 舞会 等 问题 。 平 凡 的 问题 ， 期 待 您 不 平凡 的 解答 ， 


小 注 
依次 排 (Sorting) 的 方法 很 多 ， 但 都 不 能 低 于 OCnlogn)， 


Pe 
. 


读者 可 在 一 般 Database 的 书 或 第 七 章 中 找到 有 关 Sorting 的 


法 则 . 


2. 又 称 呈 多 项 式 上 升 ， 但 因 一 个 "的 多 项 式 的 大 小 ， 在 ?很 大 


时 都 为 第 一 项 所 支配 ， 故 可 写成 OCm*)。 


3. 并 不 失去 一 般 性 ， 即 若 距离 不 是 正 整 数 也 可 以 把 它们 化 成 


正 整 数 。 


4， 在 古 克 的 原文 中 ， 并 没有 NP-complete，NP-hard 之 明确 
定义 , 但 是 由 于 他 的 论文 ， 使 这 种 分 法 显得 很 自然 ， 不 过 


NBP-hard 之 定义 仍 因 人 而 异 ， 不 一 定 同 于 本 文 。 
5. 本 文中 之 解决 ， 均 指 一 个 CC 计算 量 的 解法 。 


6, 与 情报 人 员 的 单线 作用 相同 ， 一 个 谍报 人 员 只 知道 他 的 顶 
头 上 司 及 他 的 第 一 线 下 层 下 属 , 其 余 的 人 他 都 不 应 该 知道 
7， 4，B，C 表 任 三 城 ， 而 4(4，BD)，d(B，C)，4(4，C) 分 
别 表示 4，B; C，C，4 城 之 上 距离 , 则 4(4,B)I<d(4,C)+ 


G(CB，C) 称 为 三 角 不 等 式 。 
: 7 均 指 问题 。 
9， 指 19x 19 的 模 盘 ， 许 多 计算 机 学 家 都 是 围棋 高 手 ， 中 国 的 
算盘 与 围 横 ， 好 像 包含 了 计算 机 的 开始 与 终极 。 
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第 五 章 ”自动 校正 码 理论 浅 介 


81 前 


只 


近代 资讯 科学 的 快速 发 展 ， 得 力 于 电子 计算 机 的 普及 与 多 
频道 通讯 网 的 形成 ,二 者 相辅相成 , 缺 一 不 可 。 若 少 了 快速 通讯 
网 ， 则 每 个 电子 计算 机 必须 由 键盘 、 磁 带 或 磁 矶 输入 资料 ， 大 
大 地 减低 了 快速 的 功能 、 但 是 车 没有 计算 机 在 通讯 网 的 两 端 ， 
则 快速 的 通信 无 法 及 时 消化 ， 亦 不 能 发 挥 其 最 大 的 功能 。 可惜 
.目前 尚未 能 完全 保证 通讯 中 不 发 生 错 误 . 发 生 错 误 的 原因 很 多 ， 
有 自然 因素 如 雷电 ， 有 人 为 因素 如 强 电流 及 别 的 通讯 信和 号 所 带 
来 的 干扰 。 本 文 所 要 讨论 的 就 是 如 何 发 现 或 自动 更 正信 号 在 通 
讯 中 所 发 生 的 错误 ， 

电子 计算 机 加 上 通讯 网 ， 其 所 处 理 的 资料 之 多 ， 信 号 传递 
之 快 ， 已 不 是 人 肉眼 校对 可 以 胜任 得 了 的 ， 我 们 必须 在 计算 机 
通讯 的 本 身 加 上 检 错 的 装置 。 一 个 浅 而 易 见 的 检 错 法 就 是 把 要 
传送 的 信号 重复 一 次 ， 如 两 者 不 合 则 必定 有 错 。 比 如 今 有 基 个 
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被 重复 的 信号 是 某 人 存 了 一 万 元 及 某 人 在 了 一 千 元 ,二 者 不 符 。 
至 少 有 一 个 错 ， 也 许 你 会 说 ,如 果 两 次 传递 都 发 生 了 同样 的 错 ， 
把 一 万 误 传 成 了 一 千 ， 不 就 查 不 出 来 了 吗 ? 不 错 ， 但 且 看 两 次 
同时 出 错 的 可 能 性 是 多 少 ? 假定 一 次 出 错 的 或 然 率 是 p， 则 二 
次 同时 出 错 的 或 然 率 是 p*'，。 这 儿 的 7 必须 是 很 小 的 数量 , 否 
则 信号 老 是 出 错 ， 改 不 胜 改 , 则 此 种 机 器 尚 不 宜 问 市 或 要 修理 ， 
设 P 是 十 万 分 之 一 ， 即 107', 则 p?=1071°* 即 十 亿 分 之 一 的 或 然 
率 ， 碰 到 了 这 种 同时 出 错 的 事 ， 真 是 天 亡 我 也 。 

有 时 知道 有 错 还 不 够 ， 因 一 个 信号 被 送 两 次 而 不 符合 ， 必 
是 错 了 ， 但 却 不 知 谁 对 谁 错 ， 只 好 请 对 方 重 传 一 次 ， 这 往往 是 
一 个 耗 时 费事 的 程序 ， 发 方 必须 打 断 原 有 的 传递 ， 重 新 找到 对 
方 所 说 传 错 的 位 置 ， 重 新 再 转 一 次 。 若 是 “ 知 错 能 改 ”， 岂 不 是 
“ 善 莫大 妖 ? 的 事 中? 何不 每 个 信号 传 三 次 ， 取 其 多 数 ? 由 或 然 ， 
率 看 来 ， 每 个 信号 传 三 次 ， 是 极 具 有 自动 更 正 的 功能 ， 但 代价 
是 否 太 大 ? 一 个 信和 号 传 三 次 ， 也 许 太 浪费 了 吧 ? 有 没有 更 经 济 
的 方法 ? 

为 了 使 我 们 的 回答 更 合 于 电子 计算 机 通讯 ， 我 们 就 采用 它 
们 之 间 通 信 的 符号 ， 即 以 数码 0，1 所 组 成 的 数字 来 代表 信和 号 ， 
像 现 在 电脑 中 英文 通讯 所 用 的 ASCII 电 码 是 由 七 位 数码 组 成 的 * 
例如 a 是 1100001,6 是 1100010，1 是 0110001， 因 每 位 数 有 两 个 
可 能 性 ， 所 以 一 共 可 以 排出 27= 128 个 不 同 的 电码 ， 足 够 表示 
英文 大 小 写字 母 、 标 点 符号 、 数 字 、 希 腊 字 母 了 。 为 了 说 明 简 
洁 起 见 ， 我 们 今 用 两 个 数码 来 表示 4 个 信号 ， 即 如 下 页 的 表 1. 

现在 看 ， 若 是 o 为 00 误 传 成 了 01， 我 们 会 以 为 信号 是 0 ， 
无 法 确定 会 有 错误 ， 若 我 们 每 个 信号 传 二 次 ， 即 a 以 0000 传 ， 
0 以 0101 传 ， 等 等 。 则 如 果 a 的 0000 错 传 成 了 0100， 则 我 们 就 
知道 出 毛病 了 ， 但 却 不 知 它 是 由 0000 或 者 0101 而 来 ， 由 于 二 者 
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都 只 含 -- 个 错误 。 当 然 0100 也 可 能 是 由 1111 误 传 而 来 ， 但 因 一 
个 错误 比 多 个 错误 的 机 会 小 得 多 ， 我 们 最 好 的 选择 是 假定 只 有 
一 个 错误 ,这 是 引用 了 统计 学 上 常用 的 最 大 可 能 原则 (maximum 
likelihood principle)。 它 也 是 我 们 日 常 推测 事情 真相 的 原则. 
比如 我 们 在 地 上 拾 到 了 一 笔 钱 ， 我 们 总 会 推测 这 是 有 人 遗失 的 
〈 要 交 给 警察 )， 而 不 会 认为 是 有 人 故意 放 一 笔 钱 在 地 上 做 好 事 
送 给 人 可 以 谢谢 他 而 据 为 已 有 ), 因 为 后 者 的 可 能 性 太 小 ， 在 
没有 其 它 的 证 据 之 下 ， 我 们 不 会 做 后 者 的 推测 ， 

再 仔细 研究 一 下 ， 我 们 之 所 以 知道 0100 信 号 有 错 ， 是 因为 
0100 不 在 对 方 输出 的 码 中 ， 因 对 方 只 可 以 输出 0000，0101， 
1010， 及 1111 的 其 中 之 一 ， 可 见 若 要 能 检 错 ， 输 出 码 不 可 以 占 
用 了 全 部 可 能 的 码 字 ， 为 了 统一 起 见 ， 我 们 作 以 下 的 定义 ， 

定义 5,1 内 是 用 # 位 0 或 1 作为 一 个 单元 (或 数码 》 输出 入 
信号 者 ， 称 为 一 "位 码 (输送 ) 系统 (或 简称 为 码 )。 其 中 任何 
一 个 信号， 若 含 有 1% 个 数码 ， 称 之 为 一 个 码 字 《注意 文中 有 时 
将 “ 字 ” 省 去 )。 

定义 5S,2 在 4 位 码 系统 中 ， 其 前 ml(m<n) 位 称 之 为 信息 
码 ( 或 原 码 ), 它 是 我 们 所 有 要 传 的 信号 ， 而 后 1= 1 一 机 位 称 为 
检定 码 ， 是 用 来 检定 或 改正 错误 而 用 。 

下 文中 所 谓 检 定 8 位 是 指 说 可 以 知道 至 多 有 8 位 数码 错 了 ， 
而 校正 & 位 是 指 说 把 至 多 有 A 位 错 的 数码 的 位 置 找 出 来 。 
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以 表 1 及 重复 传送 为 例 ， 其 前 两 位 是 信息 码 ， 后 两 位 是 答 
定 码 ( 见 表 2)， 其 中 必 =4, m= 2,，t=2,。 


鹤 2 


00 0000 00 

01 0101 01 
| 10 1010 10 
| 11 1111 11 


用 表 2 的 输送 码 ， 我 们 已 知 他 们 可 以 检 错 一 位 ,但 不 能 更 正 
错误 ， 对 检 错 一 位 的 要 求 而 言 ， 我 们 又 不 知道 这 种 重复 输送 是 
否 是 最 经 济 的 办 法 〈 答 案 是 否定 的 ， 我 们 在 第 三 节 会 谈 到 )， 
现在 ， 我 们 可 以 把 我 们 想 解决 的 命题 写 下 来 了 ， 

对 一 个 原 为 m 位 的 信息 码 ， 我 们 最 少 要 加 上 多 少 位 的 检定 
码 t， 使 之 可 以 自动 检定 或 更 正 & 位 的 错误 ? (1) 

在 上 面 的 命题 中 ，m 与 8 为 已 知 数 ， 而 + 为 待定 的 数 ， 

要 解决 这 个 问题 ,我 们 首先 把 这 些 码 字 用 向 量 的 符号 表示 ， 
并 定义 两 码 字 的 距离 ， 然 后 我 们 证 明 当 可 以 输出 的 码 字 之 间 都 
有 相当 大 的 距离 时 ， 某 些 位 的 错误 就 可 以 检定 或 校正 。 

看 本 文 所 需要 的 预备 知识 是 矩阵 的 一 些 基 本 运算 ， 最 后 在 
结论 中 ， 我 们 提出 了 一 些 较 难 的 问题 ， 供 有 兴趣 的 读者 思考 或 
做 更 深入 的 研究 ， 


0 Ta 


§ 2 ”如 何 表 示 码 字 与 它们 之 间 的 关系 


我 们 延 用 定义 1、2 中 的 符号 mm，Pm，f， 如 果 以 Z 表 {0,1} 之 
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集合 ， 则 mn 位 信息 码 可 以 Z" 表 示 之 ， 妈 
2Z"= {CT 2 ) Yi 二 0 或 1} (2) 
其 中 一 共有 2" 个 元 素 . 同 样 我 们 用 Z" 表 示 所 有 4?# 位 码 字 之 集合 ， 
则 制 码 法 就 是 把 一 个 Z" 中 的 元 素 镶 到 Z" 中 去 的 函数 ， 以 表 2 为 
例 ， 重 传 就 是 把 Z: 中 的 元 素 (Cal ,4,) 镶 成 Z* 中 的 元 素 (a1 ,4;， 
ais 4,) ,以 一 般 甬 数 符 号 表示 ， 则 
f=Z"->Z" (3) 
表示 一 种 制 码 法 ， 令 A 为 ] 之 区 域 ， 即 
A=f(2")={f()|z EZ"} 
则 很 显然 的 A 二 Z"， 我 们 又 称 4 为 输出 码 表 ， 而 且 在 我 们 表示 
向 量 (z:，z:，…，zn)， 有 时 不 加 逼 点 ， 即 在 表 2 中 的 0， 我 们 
可 以 写成 (0,1,0,1) 或 (0101)。 
定义 5.3 在 (3) 中 的 制 码 法 如 果 在 收 到 的 ”位 码 字 中 有 k 
位 或 8 位 以 下 的 错误 时 ， 能 知道 收 到 的 码 字 有 错 , 则 此 种 制 码 法 
称 之 为 有 检定 8 位 错误 的 功能 ， 若 其 能 校正 此 8 位 错误 ， 则 称 之 
有 校正 & 位 错误 之 功能 。 
例如 表 2 中 的 输送 码 ， 有 检定 一 位 错误 之 功能 ,但 没有 校正 
一 位 之 功能 ， 
定义 5.4 〈 汉 明 (Hamming) 距 离 ) 设 生 ，Y 为 Z" 中 的 两 元 
素 ， 则 羡 与 了 之 间 的 距离 定 为 HCX，Y)= 关 ,了 中 不 相间 的 数码 
之 数目 。 
例如 ， 和 = (1010)，Y= (1001)， 则 因 开 与 Y 有 二 位 〈 第 
三 、 四 位 ) 不 相同 ， 故 HCX，Y)=2， 车 令 0=(0,0,."，0)E 
Z"， 即 全 含 0 的 元 素 ， 则 
H( 半 ，0) = 六 中 所 含 1 的 数目 
并 以 | 站 | 表示 之 。 
定义 5.5 令 半 =(X1， TT ) 
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Y=(y1, Ys ***, Ys) 
则 定向 量 之 加 减 ， 
XY=(T1 + Ttys, ,Tty,) (4) 
且 在 上 式 中 ， 
1 士 1=0 士 0=0， 
1 土 0=0 土 1=1。 
也 就 是 说 ， 如 果 z; 与 ,相同 ， 则 它们 的 差 为 0"， 否 则 为 1。 
由 此 很 容易 看 出 X、Y 的 距离 
HCX, Y)=|X-Y| C5) 
一 些 不 熟悉 抽象 数学 的 读者 也 许 会 觉得 1+ 1=0 很 怪 , 但 如 
我 们 抽象 地 把 0 .1 分别 相应 “ 偶 ”、“ 奇 ”两 个 概念 ,就 不 会 惊讶 
了 ， 且 我 们 只 有 0 与 1 两 个 数 ， 因 此 1+1 上 只 有 等 于 0 或 1 两 个 选 
择 ， 若 令 1+ 1=1， 则 会 造成 1=0 的 结果 ， 二 元 变 成 了 一 元 ,一 
些 主 要 的 演算 特性 都 消失 了 ， 因 此 只 好 定义 1+1=0, 而 熟悉 抽 
象 数 学 的 人 知道 这 样 的 定义 加 上 一 般 的 乘法 
0.1=1.0=0.0=0, 1.1=1 (6) 
使 得 {0,1} 成 为 一 个 域 ,这 样 上 面 定 的 向 量 集合 就 自然 形成 一 个 
向 量 空间 了 。 
由 上 面 的 运算 规则 ， 很 容易 可 以 得 到 及 了 解 下 面 一 些 定理 
定理 5.1 令 X，Y，2Z 为 2 中 之 任意 三 元 素 ， 则 
(1) HCX, Y)=|X+Y| 
二 | 了 -YY| 
=H(Y, X) 
(2) 了 荆 + 祥 =~ 对 二 0 
注意 由 此 可 得 站 = ~ 六 的 一 电 要 事实 。 
(3》 若 羡 关 Y， 则 鲜 土 Y 寺 0 
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(4) HCX, Y)<H(X, 2)+ HC(Y, 2Z) 
三 角 不 等 式 (”) (7) 
在 结束 本 节 之 前 ， 我 们 定义 2" 一 个 子 集 的 离散 度 。 
定义 5.6 令 A4cCZ*"， 则 4 的 离散 度 定 为 
dCA)=min|X ~ Yi=min|X + 了 | (8) 


Yeéa 
XY XY 


则 d《4) 为 4 中 不 同 元 素 间 距离 的 最 小 值 ， 
定义 5.7 今 Ac2"*， 若 人 EA,YE A 可 以 导 至 Xt+YE Ah， 
则 4 称 为 Z" 的 一 个 封闭 子 集 ， 
定理 5.2 若 4 为 一 封闭 子 集 ， 册 
d(A)=min|X| 


证 明 很 显然 ， 因 C8) 式 中 革 +Y 了 可 以 A 中 的 元 素 表示 之 , 例 
如 表 2 中 的 输送 码 为 一 封闭 子 集 ， 而 其 离散 度 为 2， 再 回 到 表 2， 
表 2 的 制 码 法 可 以 用 矩阵 的 乘法 表示 ， 我 们 若 以 X。 表 二 位 的 信 
息 码 ， 而 芯 表 四 位 的 输送 码 ， 则 


rioid 
x=z,| 1?3?] 
_ 10107 
= (2 zy)| 010 1 


当然 ,一 般 的 制 码 法 (3) 并 一 定 可 以 以 这 种 滋 法 表示 ， 但 可 
以 用 这 种 乘法 表 的 制 码 法 至 少 有 两 个 好 处 ， 第 一 是 规则 简单 ， 
第 二 是 它 所 形成 区 域 4=/(2") 是 Z" 中 的 一 个 封闭 子 集 ， 这 个 特 
性 我 们 会 在 第 四 节 中 用 到 。 
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定理 5.3 设 4 为 一 码 表 ， 则 它 能 检验 出 至 多 & 位 错误 的 充 
可 条 件 是 4C(A) 宝 k+1， 即 4 的 离散 度 必 须 大 于 或 等 于 k+ 1。 

证 明 充分 性 ， 设 d(4) 之 k + 1， 疼 为 XX 之 误 传 ， 因 
1 对 -|<<h， 而 dCA) 之 kh+ 1， 故 了 4， 必定 有 错 ， 

必要 性 ， 若 dCA4)<&， 则 存在 X*、Y，|XX-Y|<h， 因 我 
们 锡 许 个 错误 ， 故 Y 可 以 为 X 之 误 ， 但 因 Y € 4A, 我 们 不 知 可 能 
的 错误 ， 与 假设 要 求 不 合 。 

在 这 儿 要 注意 一 点 的 ， 所 谓 可 以 检 出 & 个 错误 是 指定 义 3 所 
说 的 ， 如 果 开 有 AR 个 错 ， 我 们 只 知道 它 至 多 有 R 个 数码 错 了 ， 但 
并 不 知道 错 在 何 处 。 对 数码 为 0(、1 的 码 字 而 言 ， 一 旦 知道 错 在 
何 处 ， 就 等 于 可 以 改正 了 ， 以 表 2 为 例 ， 因 d(4)=2，R= 1， 因 
此 ， 如 果 有 一 位 误 传 ， 我 们 可 以 知 错 ( 但 不 知 错 在 何 处 )， 若 有 
两 位 发 生 错误 ， 例 如 0101 传 成 0000, 则 我 们 就 发 现 不 出 错误 了 ， 
这 要 d(4) 宇 3 才 行 . 

由 定理 5,3 可 知 若 要 检定 输送 的 码 字 是 否 有 一 个 或 一 个 以 
下 的 错误 ,我 们 得 要 有 d(4) = 2， 若 不 加 检定 码 ， 因 4 的 元 素 皆 
为 信息 码 ， 于 是 d(4)= 1， 不 可 能 检定 错误 。 因 此 我 们 至 少 要 
加 一 位 检定 数码 。 现 在 我 们 要 证 明 只 要 加 一 位 检定 数码 就 足以 
检定 一 位 的 错误 ， 因 此 表 2 中 的 重复 输送 是 不 必要 的 。 令 0(Y) 
表 工 的 奇偶 数 (Parity)， 即 

oCD = 人 如 果 了 含有 奇数 个 1 
0 如 果 开 含有 偶数 个 1 
则 很 容易 证 明 下 面 的 定理 。 
定理 5,4 车 XY, OC(X)=0CY) 


(9) 
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则 HCX，Y) 之 2 (10) 

推论 若 4 中 之 元 素 均 有 相同 的 奇偶 数 , 则 若 在 输送 时 出 了 
一 ' 位 错 ， 我 们 可 以 检 出 。 

要 使 得 所 有 码 表 中 的 元 素 都 有 相同 的 奇偶 数 是 很 容易 的 
. 事 ， 只 要 在 信息 码 后 加 上 一 位 奇偶 检定 码 使 之 成 为 一 个 含有 偶 
数 个 1 的 输送 码 就 可 以 了 ‘*，， 因 此 对 表 1 的 四 个 信号 而 言 ; 可 以 
检定 一 个 错 的 编码 法 是 令 4=000, b=011, c=101, d=110， 

奇偶 检定 码 与 原 码 字 长 度 m 无 关 , 前 面谈 到 的 ASCII 码 都 是 
七 位 再 加 一 位 奇偶 检定 码 。 因 此 a 实际 是 八 位 的 11000011， 

若 要 使 表 1 中 的 信息 码 有 检定 二 个 错 的 功能 ， 必 须要 d(4) 
之 3， 字 码 表 (10〉 是 不 行 的 ， 因 qd(4) = 2， 再 加 一 位 检定 码 行 
不 行 ? 管 案 是 不 行 ， 但 这 不 是 一 眼 可 以 看 出 来 的 ， 加 两 位 尾数 
的 方法 很 多 ,但 我 们 可 以 用 穷 举 法 证 明 , 若 是 我 们 令 0 为 0041a，,， 
6 为 016.6,，c 为 10c1cs, 则 不 可 能 使 得 它们 之 间 的 距离 都 不 小 
于 3， 加 上 三 位 如 何 ? 这 就 更 难 验 算 了 ,我 们 把 这 个 问题 与 下 节 
的 自动 校正 码 合并 ， 我 们 将 证 明 可 以 检 二 位 错 的 检 错 码 ， 就 有 
自动 改正 一 位 错误 的 功能 。 

在 结束 本 节 之 前 ， 我 们 要 顺便 提 一 下 ， 当 我 们 加 码 来 检定 
错误 ， 也 会 因 码 位 加 多 而 增加 了 一 个 码 字 发 生 错误 的 或 然 率 ， 
但 在 出 错 或 然 率 p 很 小 时 ， 仍 为 “合算 ”， 读 者 很 容易 算出 增加 
码 位 后 发 生菜 种 错误 的 或 然 率 , 因 非 本 文 主旨 ,我 们 不 再 详 谈 ， 
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定理 5.5 一 个 输出 码 表 4 能 校正 至 多 k 位 错 码 的 充 要 条 件 
是 d(A) 之 2k+1。 
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证 明 充分 性 ， 设 dCA) 宇 2k+1。 我 们 要 证 明 若 卫 去 Y， 
区 误 传 成 尺 ，Y 误 传 成 了 ， 其 错误 均 不 超过 R 个 ， 则 部 这 了 ， 因 
| 王 - 六 RAR，| 了 -了 | 入 
由 三 角 不 等 式 及 | 鳃 了 | 之 2k+ 1， 得 
[|X-7 了 |>|X-YI-IY-P| 
之 |X-Y|-|X- 对 ||-|Y- 了 | 
宇 1 
故 下 二 了 了 ， 即 全 与 Y 不 可 能 混合 误 传 ， 
必要 性 ， 设 dC(A)<<2k， 则 可 找到 蔷 ，Y E44 目 [|X-Y|=4 
志 2k， 我 们 不 妨 假定 X 与 Y 在 te14，…，Q, 位 置 上 不 同 ， 取 与 X 
仅 在 a,…a; 位 置 上 不 同 ， 则 
| 全 -XI=k 
[|X-Y|=q-hk<k 
故人 之 错 不 能 改正 ， 因 不 知 它 是 由 避 或 了 而 来 ， 本 定理 证 毕 。 
因此 车 要 编 一 个 可 以 改正 R 个 (或 & 个 以 下 ) 的 校正 码 ， 只 要 
在 每 个 为 m 位 的 信息 码 后 加 车 干 位 的 数码 ， 使 得 它 的 输送 码 有 
28+ 1 的 离散 度 就 可 以 了 。 
” ”定理 5,6 对 具 m 个 数码 的 信息 码 4， 车 加 上 t 位 的 检 错 数 
码 ， 使 之 可 以 自动 校正 8 或 8 个 以 下 的 错误 ， 则 t 必 满足 。 


1+(" N+ (<2 (11 
+(")+(") et() 
上 式 中 n= 二 m+t。 


证 明 ， 在 4 中 有 2" 个 码 字 。 任 一 个 码 字 车 错 了 0，1，…， 
位 时 ， 必 不 能 与 男 一 个 码 字 错 了 0,1,…,k 位 时 相同 。 因 每 个 码 


字 有 () 个 与 它 差 一 位 的 ，(”) 与 它 差 ? 位 的 ,…， 的 字 码 ， 加 
上 自己 ， 可 见 每 一 个 A 中 的 元 素 都 占有 了 
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Or 
个 码 位 ， 因 2Z" 只 有 2* 个 元 素 ， 故 
n 如 
[i (< 


消去 2"， 得 (I1)， 
注意 ,一 般 书 中 对 原 码 字 为 m 位 ， 检 定 码 字 为 1 位 的 线性 二 
元 码 的 新 码 以 Cm，+) 码 天 之 ， 
在 CI1) 中 ， 因 #=m+t， 并 没有 公式 可 以 表 示 # 的 解 ， 但 
用 代入 法 ， 很 容易 算出 在 给 定 m 时 ， 景 小 可 以 满足 (11) 之 1， 我 
们 称 之 为 之 下 界 ， 它 们 的 值 可 在 表 5 中 看 到 。 比 如 说 m=10， 
R=2， 则 至 少 得 加 8 个 检定 数码 不 可 ,但 如 何 加 这 8 个 检定 数码 ， 
却 是 一 个 难题 。 因 为 在 (3) 式 中 的 可 以 千变万化 。 在 此 我 们 只 
讨论 一 种 规则 的 编码 法 ， 一 般 称 之 为 线性 码 ， 或 群 码 ‘3) ,我 们 
要 求 在 编码 : 
六 Zr->Dr (12) 
中 的 六 为 一 矩阵 Fo， 用 符号 表示 ， 
1(Xn)=X, XEZ", LEZ 
F 为 一 m xn 的 矩阵 ， 且 
天 = XP (C13) 
为 了 保持 前 面 m 位 原 码 的 数码 不 变 ， 我 们 将 F 写 成 2 个 子 矩 阵 ， 
mx m 的 恒 等 矩 阵 扎 及 m x i 的 矩阵 D， 即 
-100 一 
010D 


= .1, :D] 


一 0 1 一 | 
亦 即 
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有 居 一 居民 一 [科大 DD” (14) 
如 何 找 到 D， 使 得 dCA) 宇 2&8+ 1 是 制造 校正 码 的 关键 , 它 的 原理 
却 很 简单 ， 先 定义 一 个 nx 1 的 矩阵 M 如 下 ， 

D 

“=[ ] C15) 
上 式 中 7 为 一 个 fx 前 恒 等 矩 阵 ， 则 车 了 E44， 由 (14) 及 (7)@ 
可 知 

, ,FD 
XM=[ Xi Xp 二 "| 
一 Zo 也 二 Zn 
= 0 (16) 
将 XX 与 M 以 另 一 形式 展开 ， 即 令 苹 = (Zi Da…y zy 把 M 分 解 
为 4 个 + x 1 的 向 量 


三 2 
: US, 
M=| . 
| 
则 C16) 成 为 
KXM=(T12))| : 
一 UN 一 
= rv,=0 (17) 


由 这 个 关系 ， 我 们 可 以 证 明 编 校正 码 的 一 个 基本 定理 。 

定理 5.7 在 (14) 中 的 D， 当 它 写 成 (15)、(17) 式 时 ， 若 没 
有 任何 2 个 之 内 的 Uy 1029 9 Us 加 起 来 为 0， 则 aq(4) 宇 28 
+ 1。 
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证 明 由 (17) 式 可 知 ， 2 ri0i=0, 但 没有 28 个 vi， "sD, 


加 起 来 是 (的 ， 记 以 (xz ，z:。…，zn) 中 至 少 要 有 28+ 1 个 1 才 行 。 
因此 除了 < 站 =0 之 外 ，| 羡 | 宇 2k+ 1， 因 A 为 一 封闭 子 集 (4， ， 由 
定理 5.,2 可 知 

dA)=min| X|>2k+1 


本 定理 得 证 ， 

定理 5.8 ” 若 h=1， 则 任何 n 个 不 相同 的 ww 可 使 得 (14) 的 转 
换 满足 gC4) 之 3， 又 用 此 法 时 + 必 满 足 ms2-t-1， 

证 明 因 任何 两 个 不 相同 的 w 相 加 不 等 于 零 向 量 0。 由 定理 
5.7 很 容易 证 得 本 定理 。 因 t 位 检定 码 字 只 有 2' -~ 1 个 异 于 0 的 向 
量 ,而 我 们 需要 mn 个 不 同 的 , 故 必 须 有 n 和 2- 1* 即 凡 委 2 一 1 

推论 ” 当 R=1 时 ， 用 (14) 所 制 成 的 最 经 济 ( 指 1 大 小 而 言 》 
的 校正 码 ， 就 是 最 经 济 的 校正 码 。 

证 明 比较 定理 5.8 与 定理 5.6， 可 知 当 &=1 时 ， 不 满足 
Ms 和 2:-+ 一 1 的 t， 也 就 是 不 满足 (11)， 即 不 可 能 以 任何 方式 做 
成 校正 码 。 

现 以 m= 4 为 例 ， 由 丸 委 2 ~ {~1 可 知 最 小 的 t 是 3,M 中 v 的 
选 法 只 有 一 种 ， 我 们 要 用 全 部 的 2 ~ 1= 7 个 向 量 。 可 令 
11- 

10 
01 
11 
00 
10 
0 1- 


和 
二 一 
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因此 


-1000111- 
0100110 
| 0010101 
-000101 1 
表 3 中 有 这 种 字 码 表 ， 
家 3 由 羡 = 半 .F，(17?) 式 所 制 成 的 一 位 自动 校正 码 

原 码 《或 信息 码 ) 掖 正确 
Xl Ta Xa 2 Xs Xe 27 
0 0 0 0 0 0 0 
0 0 0 1 0 1 1 
0 0 1 0 1 0 1 
0 0 1 1 1 1 0 
0 1 0 0 1 1 0 
0 1 0 1 1 “0 1 
0 1 1 0 0 1 1 
0 1 1 1 0 0 0 
1 0 0 0 1 1 1 
1 0 0 1 1 0 0 
1 0 1 0 0 1 0 
1 0 1 i 0 0 1 
1 1 0 0 0 0 1 
1 1 0 1 0 1 0 
1 1 1 0 1 0 0 
1 1 1 1 1 1 1 


要 解码 ,也 很 容易 ,最 原始 的 解法 是 比较 收 到 的 信号 了 与 所 
有 A 里 的 元 素 , 取 其 最 近 者 ,车 全 只 有 一 位 或 没有 错误 , 则 由 码 表 
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中 找 出 这 个 最 接近 的 输出 码 字 ,就 是 所 求 的 校正 的 码 字 了 .例如 

全 =0101000 (18) 
把 它 与 表 1 中 的 元 素 比较 ， 可 知 它 与 0111000 最 近 ， 如 果 只 有 一 
位 错 ， 必 定 是 由 它 产 生 的 ， 

但 如 果 m 很 大 ，A 中 有 2" 个 元 素 ， 如 作 一 一 相 比 较 , 对 大 量 
的 信号 而 言 是 可 观 的 计算 量 ， 若 令 e。=0，8e;= 只 有 ;位 含 1 的 “ 
维 向 量 ， 因 只 有 一 位 错 ， 则 在 字 +e,， i=0, 1 ， n 中 必 有 
一 个 属于 4。 换言之 ， 若 是 第 /位 错 ， 则 取 +e:€ Ah, 因 凡 在 A 中 
之 元 素 皆 适合 (17)， 故 

(+eM=0 (19) 
在 计算 时 (19)〉 可 以 简化 成 XM =e;M, 故 只 要 比较 人 M 与 ejM 就 
可 以 了 。e;M 是 定向 量 ， 可 以 先 存 起 来 ,而 们 M 又 要 乘 一 次 就 行 
了 ， 若 m 不 很 小 ，2" 之 #， 比 较 4+ 1 个 向 量 要 比比 较 2" 向 量 快 多 
了 。 
以 表 1 为 例 ，e;M 如 下 表 ， 


来 4 
ej eM 
(0000000) (000) ( 没 错 ) 
(1000000) (111) 
(0100000) (110) 
(0010000) (101) 
(0001000) (011) 
(0000100) (100) 
(0000010) (010) 
(0000001) (001) 
再 以 (18) 为 例 ， 
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了 


XM= (00101000) =(101) 


pl 


0 
-0 
与 esM 相 人 台 ， 即 在 第 3 位 发 生 错 误 ， 原 码 应 为 
六 +es=(0111000) 
与 直接 比较 的 答案 相同 。 
定理 5.8 的 推论 不 可 以 推广 到 Rz2 的 情形 去 ， 因 当 b 之 2 时 ， 
线性 码 ! 的 下 限 与 任何 码 的 下 限 (11) 不 同 ， 
定理 5.9 若 以 (14) 法 编 可 以 校正 至 多 含 2k+ 1 个 数码 错 的 
码 ， 则 it 必须 满足 
n—l 1 一 ] ae n~-1 LM 
( | )+( ， )+ + 1 (20) 
证 明 用 (14) 编 码 ， 我 们 必须 找到 n 个 :x 1 的 非 0 向 量 v1， 
v,，…,v, 使 得 没有 任何 2k 个 加 起 来 会 是 0, 这 种 向 量 的 找 法 可 用 
“第 ”的 方法 ， 先 取 任 2 个 异 于 0 的 向 量 v1,v?。, 凡 是 与 这 两 个 向 量 
相 加 可 以 为 0 的 向 量 全 部 去 掉 ， 在 余下 的 向 量 中 任 取 一 个 作 2,， 
第 去 上 凡 能 与 01,0,,03 加 起 来 为 0 的 向 量 ， ，…， 假 定 我 们 21,2,， 
…，y; 时 已 找到 了 2k 一 1 个 向 量 ， 则 我 们 必须 对 所 有 的 v;:， 两 个 
v; 的 和 ， 3 个 ov 的 和 ,… 一 直到 2k 一 1 个 v， 的 和 都 第 去 ， 因 为 它们 
都 可 以 使 M 不 合 要 求 ( 例 如 我 们 取 了 2* 二 21+0s+08， 则 w+ 
vid+os+us=0)。 这 一 共 筛 去 了 


i 


(C(tet(ye)) 
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1 1 
1 0 
0 1 
11 
00 
10 
0 1 


冠 噬 上 心 炎 


人 


个 向 量 ， 因 一 共 只 有 2 ~ 1 异 于 0 的 ! 位 向 量 ， 故 对 i= 1,2，…， 


n~ ] 而 言 


i 十 i 十 * 十 i <2—1 (21) 
(rr ) 
都 要 成 立 ， 特 别 是 当 i=n ~ 1 时 左 式 最 大 时 (21) 式 也 得 成 立 。 故 
本 定理 得 证 。 


满足 定理 5.9 的 t， 经 我 们 用 计算 机 算 了 一 些 数据 ， 它 们 的 
值 列 在 表 5 中 。 可 见 当 k>>1 时 ， 线 性 码 可 能 不 是 用 的 最 小 的 
但 由 于 线性 码 容 易 制 ， 而 又 容易 解 ， 所 以 是 最 常用 的 编码 法 。 


襄 5 ”对 mm 位 信和 号码 所 要 加 的 最 小 尾 位 数 以 作成 k 位 校正 码 
在 线性 码 ! 的 下 界 由 公式 (20) 得 出 ， 一 般 下 界 t 由 公式 (11) 得 出 


Ek/m 12 3 4 5 6 7 8 9 1020 830 4050 
1, 线 性 码 t 2 3 33 444444 56656 
一 般 ! 2333444444566 6 
2 .线性 码 t 4788991010101l11313441516 
一 般 t 456677 7 7 88 .9101111 
3 .线性 码 t 6 11 12 13 1415 15 16 16 17 20 22 23 24 
一 般 t 6 889 9101010111113141516 
4 ,线性 码 t 8 15 16 18 19 20 20 21 22 22 26 29 31 32 
一 般 ! 8 10 11 11 12 1213 13141417 18 19 20 


85 结 论 


有 人 说 “好 的 理论 ， 它 必 是 简洁 的 ”， 我 们 已 看 到 了 校正 码 
理论 简洁 的 一 面 ， 其 中 最 主要 的 关键 在 于 说 明 距 离 的 定义 及 式 
《17)。 但 我 们 所 举 的 例子 都 在 k= 二 1， 即 改 正 一 个 错误 的 情形 . 
再 向 前 推 ， 就 应 验 了 有 些 人 说 的 ， 简 单 的 东西 都 已 经 被 人 做 
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完了 ， 所 剩 的 全 是 难 或 繁 的 题目 了 。 在 K>1 的 情形 ， 编 码 与 解 
(或 校正 ) 码 就 要 变 得 复杂 了 ,一般 所 用 的 是 一 种 叫做 循 环 码 
(cyclic code) 的 方法 ， 读 者 车 有 兴趣 ， 可 以 在 本 文 所 附 之 参考 
资料 中 找到 。 

另外 一 个 研究 方向 是 针对 码 字 中 数码 错 成 捉 的 改正 。 因 有 
时 一 个 强烈 的 干扰 因素 可 以 破坏 一 成 囊 的 电码 ， 这 时 候 ， 本 文 
所 谈 的 方法 就 失去 了 效用 。 比 如 说 ，m =7 位 的 ASCII 码 加 上 
=4 位 的 检定 码 可 以 校正 一 位 错误 ， 但 如 果 遇 到 了 一 个 强 的 干 
扰 ， 可 以 把 一 串 十 位 的 数码 全 破坏 了 .当然 我 们 再 也 无 法 用 这 
十 位 数 来 使 原 信 号 复原 了 。 很 显然 的 ， 我 们 车 用 一 个 码 字 的 传 
法 ， 则 我 们 无 法 恢复 一 个 破坏 得 很 厉害 的 码 字 。 但 我 们 若 把 所 
有 码 字 比 方 说 一 百 个 码 字 ， 同 时 放 在 一 起 加 校正 码 ， 则 有 可 能 
可 以 恢复 一 长 段 的 错误 ,事实 上 可 以 有 一 种 叫 Reed-Solomon 的 
码 , 它 只 要 在 具 833 数 码 的 信号 码 上 加 上 56 个 检定 码 就 可 以 改正 
不 多 于 22 个 成 捉 的 数码 的 错误 。 以 ASCII 码 为 例 ，833 个 数码 
含有 119 个 信号 ,而 只 要 加 56 个 检定 码 就 可 以 改 错 ， 是 非常 令 人 
惊奇 的 事 。 它 比 奇偶 检定 码 还 要 经 济 ， 此 地 的 主要 关键 在 于 此 
22 个 或 22 个 以 下 的 错误 必 发 生 在 成 一 串 的 22 个 数码 中 。 但 它 的 
理论 也 不 是 本 文 的 范围 可 以 包括 的 。 

最 后 ， 我 们 要 提 到 的 是 这 些 编码 理论 都 有 其 实际 用 途 ， 而 
且 市 面 上 有 不 少 用 这 些 方法 制 成 的 硬 、 软 体 装置 。 

小 注 
1. 这 是 假定 两 次 错误 为 独立 事件 ， 有 时 声音 会 干扰 一 般 信息 ， 

则 相 邻 的 错误 就 不 能 假定 为 独立 事件 了 ， 在 第 五 节 内 会 提 到 

这 个 问题 。 
2 , 令 全 部 码 的 奇偶 数 为 1 也 可 以 ， 
3 ,熟悉 较 高 深 数 学 的 读者 可 知 下 面 二 结果 
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《1) HH( 革 ,了 ) 是 一 个 量度 (measure)。 
《2) 2 可 以 想 成 一 个 交换 群 ,或 在 {0,1} 域 中 的 线性 向 量 空 
间 。 
4. 因 "个 码 全 用 上 了 ， 革 EA，Y EA， 则 = 苹 ,F,Y =Y,F， 
可 知 莹 + Y=(Xn+Yn)FEA, 
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第 六 章 ”模糊 集 浅 介 


$1 前 


[小 


科学 的 进展 起 动 于 满足 人 类 探求 及 解决 所 遭遇 的 问题 ， 但 
它 也 使 人 们 同时 产生 了 新 的 欲望 与 好 奇 ， 数 学 一 直 是 研究 科学 
的 主要 工具 ， 由 开始 计算 量度 的 简单 算术 、 三 角 、 儿 何 ， 演 进 
到 今天 各 式 各 样 抽象 高 深 理论 的 纯 数学 及 各 式 各 样 的 应 用 数 
学 。 不 论 怎样 ， 所 研究 的 对 象 都 是 在 各 种 条 件 明 确 规 定 下 进行 
的 。 因 为 人 们 一 直 根 深 蒂 固 地 把 数学 与 一 丝 不 苟 、 清 清楚 楚 的 
概念 连 在 一 起 。 这 也 就 是 说 以 往 的 数学 一 直 建 立 在 二 信 “ 真 ”与 
“ 假 * 的 逻辑 推理 上 。 即 对 于 一 个 命题 的 判断 只 用 “ 真 "或 “ 假 ” 来 
定论 ， 不 会 想到 渗入 介 中 性 ， 即 亦 真 亦 假 的 混合 性 。 但 大 家 都 
明白 ， 我 们 在 日 常生 活 中 所 用 的 推理 或 言论 , 大 多 是 近似 推理 ， 
用 一 种 不 经 细 辨 (模糊 ) 的 态度 去 求 结论 。 过 去 由 于 人 类 处 理 资 
讯 的 容量 有 限 ， 很 自然 使 用 二 值 逻 辑 ,但 随 着 电脑 的 普遍 使 用 ， 
人 们 觉得 一 个 事件 或 概念 的 形成 ， 可 以 把 许 许多 多 的 因素 都 放 
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进来 分 析 。 比 如 与 视觉 或 心理 因素 较 有 关 的 人 文 或 社会 学 的 抽 
象 概念 最 好 也 能 加 以 作 数 量化 的 数学 讨论 。 尤 其 过 去 几 十 年 来 
人 们 开始 有 兴趣 对 “人 工 智 能 学 ”(Artificial intelligence) 谋 
求 发 展 研 究 。 人 们 希望 对 一 些 复 杂 或 未 完善 的 系统 的 分 析 与 决 
策 过 程 ， 建 立 一 种 对 语法 及 语意 有 适当 处 理 的 数学 模式 ， 使 在 
不 可 能 很 清楚 (模糊 的 ) 情 况 下 ， 塑 造 出 一 套 可 让 机 器 “理解 ” 
一 般 自 然 语言 的 理论 。 这 样 把 原来 具 能 顾及 到 语法 的 奴隶 性 机 
器 改进 到 一 个 可 以 思考 的 “ 假 人 ”。 同 时 也 努力 把 原先 只 能 顾及 
到 语法 的 仙 农 氏 CShannon) 的 信息 理论 ， 改 进 到 能 处 理 语 意 的 
信息 论 。 这 样 才能 达到 人 对 人 工 智 能 的 期 望 及 使 用 ， 也 即 大 大 
提高 自动 化 的 境界 。 

读 到 人 工 智 能 其 功能 中 一 个 最 广 的 应 用 是 图 样 鉴定 
《Pattern Recognition)。 简单 的 说 是 由 机 器 代 人 去 辨识 或 进行 
某 种 工作 ,如 有 些 机 器 可 以 扒 识 人 们 书写 的 数字 ,大 家 都 知人 们 
概念 中 的 数字 决 无 一 正 正 板 板 的 形状 ， 如 “5” 它 可 以 具 形 状 5、 
< 、 与 等 各 式 各 样 的 情形 , 模 模糊 糊 的 存在 人 的 脑海 中 ， 不 同 地 
出 现在 人 的 笔下 。 模 糊 集 的 概念 引入 使 得 机 器 在 其 设计 及 功能 
上 能 逐步 地 向 “ 像 人 ”的 理想 迈进 。 


”$2 模糊 集 概念 及 定义 


近 一 ,二 十 年 来 自从 人 们 把 电脑 广泛 地 应 用 到 图 样 鉴定 (在 
自动 化 设计 中 )、 病 情 诊 断 、 资 源 探测 及 军事 上 种 种 导向 的 智慧 
炸弹 等 方面 后 ， 在 工程 及 电脑 界 兴起 了 所 谓 “ 模 糊 集 ”(Euzzy 
get) 的 研究 。 到 底 什 么 是 模糊 集 ?我 们 其 实在 开场 已 作 了 伏笔 ， 
其 实 它 也 不 是 什么 神奇 出 现 的 理论 ， 它 是 一 个 很 自然 应 时 代 而 
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生 ， 随 人 们 的 产物 电脑 的 发 展 引 生出 的 一 套数 学 理论 。 最 早 是 
1965 年 加 州 大 学 控制 论 教 授 查 德 (Zadeh) 先生 提出 来 的 ， 他 党 
得 日 常 的 许多 现象 及 观察 结果 不 可 能 很 精确 的 描述 ， 比 如 说 一 
个 人 的 美 丑 、 身 材 的 高 矮 、 械 艺 的 高 明 、 工 作 的 辛劳 等 很 难 定 
出 明确 的 数据 或 标准 来 处 理 。 而 在 人 们 的 思维 中 既然 有 各 式 各 
样 含糊 性 的 概念 在 支配 人 们 的 活动 ， 怎 样 将 种 种 模糊 的 物 类 或 
概念 用 数量 系 或 严谨 的 数学 来 表达 呢 ? 这 样 就 促成 了 他 对 模糊 
集 理论 的 创立 。 再 想 一 下 引入 “模糊 ”的 概念 是 恰当 的 吗 ? 我 
们 看 看 一 个 实际 的 问题 ， 如 去 识别 一 个 人 ， 我 们 只 要 有 点 大 概 
的 描述 ， 如 大 约 多 高 、 讲 话 带 什么 口音 、 戴 眼镜 、 神 情 严 肃 、 
大 概 儿 岁 ， 就 不 难 在 一 个 有 跟 的 范围 内 ， 完 全 确定 这 个 人 是 谁 
了 ， 不 必要 准确 的 年 龄 、 什 么 牌子 的 眼镜 、 几 尺 几 十 高， 对 于 
处 理 模糊 概念 的 关键 是 在 了 解 什么 叫 模糊 集 ? 我 们 知道 传统 的 
数学 中 所 谓 的 一 个 “ 集 ” 是 指 一 个 具有 了 明确 定义 的 事物 或 概念 
的 总 体 ， 有 了 一 个 “ 集 ” 我 们 可 以 用 它 来 判断 其 它 事物 或 概念 是 
否 属于 该 集 ， 不 会 产生 模棱两可 的 情形 ， 

模糊 集 是 照 英 文 “Fuzzy set” 一 词 翻译 过 来 的 ， 它 其 实 是 
普通 集合 的 一 种 推广 。 一般 当 我 们 给 定 一 个 集 或 集合 〈 通 常 的 
集合 意义 之 下 )， 往 往 同时 得 给 定 一 个 明确 的 概念 或 具体 的 事 
物 。 例 如 集合 ， A 二 {1，2，3，9，17,21},B= {世界 各 国 的 首 
都 } 等 等 。 因 此 对 于 任 一 个 整数 ,我 们 可 明确 地 判断 它 是 否 属于 
A? 对 任何 一 个 都 市 ,我 们 也 可 判定 它 是 否 属于 了 等 等 。 换 句 话 
对 于 任何 一 事物 ， 我 们 可 以 断然 地 判定 是 否 属于 某 一 个 集 ， 另 
一 方面 ， 我 们 可 以 说 一 个 普通 集 必 相 应 有 一 隶属 的 函数 ， 即 所 
谓 的 特征 函数 。 任 何 集 5 中 的 一 个 子 集 4， 其 实 就 是 定义 在 S 上 
的 一 个 特征 函数 fa( 注 意 / 是 一 般 一 个 函数 记号 ， 把 4 记 在 其 上 
是 为 了 显明 与 4 特别 有 关 )， 它 满足 
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0 ugA 
fw =1 ] weA 
这 表明 任何 S 中 一 元 素 对 子 集 4 的 隶属 只 有 1(100% 与 0 两 种 极 
端的 情形 。 把 这 种 普通 集合 论 中 元 素 对 集合 的 绝对 隶属 与 绝对 
不 隶属 的 关系 (4EA4 与 4EA 的 可 能 )， 加 以 放松 ， 而 提出 “ 隶 
属 程 变 ” 的 一 种 推广 概念 就 是 模糊 集 的 产生 。 因 此 我们 可 以 说 
模糊 集 是 指 在 一 已 给 定 的 讨论 域 S( 或 定义 集 上 ， 这 和 函数 一 样 
先 要 有 一 明确 的 定义 域 或 讨论 的 领域 ) 上 ， 记 规定 的 一 个 隶属 
程 变 k( 或 一 函数 但 其 值 介 于 0 与 1 之 间 ， 即 0 专 4Cx) 所 1，2z €5)， 
对 任何 8$ 中 的 元 素 都 有 一 个 值 &z) 与 之 对 应 一 一 隶属 程度 .所 以 
模糊 集 不 过 是 一 个 定义 在 一 个 普通 集合 S 上 的 一 个 函数 &， 它 满 
足 0 和 k(xz) 夺 1!，Y 2 ES。 这 样 一 来 ， 所 亩 的 普通 集合 是 模糊 集 
的 一 个 特殊 情形 了 。 所 以 我 们 也 可 预期 有 些 集 与 集 间 的 运算 结 
果 对 模糊 集 仍 是 成 立 的 ， 但 当然 也 一 定 有 不 同 之 处 的 。 我 们 现 
在 多 少 了 解 了 对 于 一 个 模糊 集 ， 没 有 必要 〈 有 时 也 是 没 法 子 ) 
说 明 它 的 成 员 ( 元 素 ) 是 哪些 ， 或 不 是 哪些 ， 而 只 表明 一 个 元 素 
能 以 多 少 的 “隶属 程 变 ” (用 0 到 1 来 衡量 ) 算 作为 其 成 员 。 例 如 
对 天 气 热 不 热 的 概念 是 
m-— 80 \ ?1 ',,- 
so 五) ] ">a 
0 m<80 

我 们 说 气温 mm 度 ( 以 华氏 计 ) 时 算 “ 热 天 ” ,此 一 模糊 集 的 灶 属 程 
度 是 Cm)， 可 见 不 到 80 度 不 算 热 ,超过 80 度 愈 多 时 ， 就 愈 可 被 
称 为 “热天 ”了 。 

注意 ， 上 面 这 个 函数 4 没有 什么 理论 根据 定 出 来 的 。 

又 就 像 在 欧 几 里 得 空间 中 ,不 同 单位 距离 定 出 不 同 的 空间 。 
在 同一 个 定义 域 S 上 ， 不 同 的 隶属 程度 (或 等 级 函数 ) 确 定 出 不 
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同 的 模糊 集 。 

还 记得 在 前 面 我 们 用 记号 f 表示 集 S 中 子 集 4 所 引 生 出 的 
特征 函数 ,在 S 中 我 们 一 旦 定 出 了 一 个 特征 函数 4， 我 们 也 就 同 
时 定 出 了 一 个 子 集 4、 反 之 亦 然 。 在 此 意义 下 ， 我 们 可 以 认为 
S 的 一 个 子 集 4 不 过 是 定义 在 S 上 的 一 特征 函数 1 了。 对 模糊 集 
我 们 也 作 间 样 的 认同 ， 为 示 别 模糊 集 与 普通 集 的 记号 起 见 ， 我 
们 通常 在 字母 的 下 方 加 一 个 “~ ”的 记号 来 表示 模糊 集 ， 如 又 ， 
如 等 ,我们 也 可 把 S 上 一 个 模糊 集 急 与 定义 在 S 上 的 一 隶属 函数 
ka 认同 ,但 在 不 致 有 混 清 的 情形 下 ,我 们 通常 用 记号 4 来 代表 4。 

所 以 ,我们 现 可 叙述 模糊 集 的 定义 如 下 ， 

定义 6.1 在 普通 集合 9S 上 ， 若 有 一 个 实 函数 /满足 

O07)<1l, YIES 
则 称 / 决 定 了 一 个 S 的 模糊 子 集 4， 对 所 有 的 z， Lus(Cz) 称 为 对 
模糊 集 4 的 隶属 程 变 。 我 们 也 称 上 为 5 的 隶属 函数 , 也 就 是 概念 
么 .一 个 模糊 集 的 主要 关键 就 是 如 何 定 出 与 某 一 概念 相应 的 隶 
属 函 数 ， 它 也 是 一 般 问 题 的 核心 . 

定义 6.2 若 和 4 为 集合 5 的 一 模糊 子 集 ， 则 普通 集合 

4,.= 人 (za TES) 

称 为 上 的 w 度 普通 子 集 。 


8 3 模糊 集 的 运算 


在 实际 应 用 问题 中 ， 我 们 遭遇 的 模糊 概念 可 能 是 若干 个 模 
糊 概 念 的 组 合 。 如 聪明 的 年 青 人 。 所 以 要 能 对 模糊 集 间 适当 地 
定 出 它们 之 间 的 运算 ， 才 能 有 所 应 用 。 事实 上 与 集合 的 运算 类 
似 ， 对 模糊 集 也 可 有 “和 ，U”，“ 交 ， 败 ”及 “ 补 :“” 等 集 的 运 
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算 ， 这 时 一 个 很 自然 的 想法 ,对 模糊 集 作 以 上 的 运算 ,可 以 通过 
对 其 相应 的 隶属 函数 作 布 氏 代 数 运算 实现 。 
定义 6.3 设 4, 3 为 集 S 上 两 个 模糊 子 集 (或 模糊 集 )， 令 
KayB C2) 一 maxf{Us(Z)，He(Z))} 
Usna(Z) 三 min{tks(z)，La(Z)} 
Wac (2)=1— Hr) 
则 以 4ua，kanas 44 为 隶属 函数 所 相应 的 模糊 子 集 分 别称 
为 4 和 BB 的 “和 集 ”,， “交集 ”及 “和 4 的 补 集 ”"， 并 分 别 以 和 UB， 么 
站 及 及 A 记 之 ， 参 看 下 图 。 并 注意 它们 也 相应 于 好 辑 学 上 的 
《或 "、“ 且 "及 “ 非 "的 三 种 明 辑 运算 。 


上 u | 
7 


图 8 ”由 0 经 t 经 4 经 S 到 a/ 表 的 图 9 由 b 经 t 经 v 经 S 到 b/ 的 曲线 为 PAna 
曲线 为 上 4uB 


图 10 册 @7->s 一 tb 为 & 的 曲线 
0->s--v>t>b 为 H.' 的 曲线 


现在 我 们 看 上 面 的 定义 合 不 合 常理 。 
例 6.1 设 S 为 甲 校 的 所 有 老师 的 集合 ， 委 及 8 分 别 代表 “ 甲 
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校 中 的 年 轻 老 师 ” 及 “ 甲 校 中 的 个 子 高 老师 ”。 两 个 模糊 集 ( 当 
然 我 们 假定 上， 都 有 了 相应 的 隶属 函数 。 现 车 申 校 的 某 老 师 为 
“年 轻 ” 及 “个 子 高 ”的 隶属 程度 分 别 为 0.8 及 0.5， 那 么 我 们 
自然 可 以 认为 该 老师 “年 轻 或 个 子 高 ”的 程度 为 0.8(=max 
《0.8，0.5))， 但 对 同一 人 我 们 认为 他 “年 轻 又 个 子 高 ?的 程度 
只 能 算 0.5(=min(0.8，0.5)), 这 是 因为 一 般 两 种 性 质 符合 的 
可 能 性 一 定 比 符合 单独 其 中 之 一 性 质 的 可 能 要 低 。 而 两 种 性 质 
只 要 具备 某 -一 的 隶属 程度 ， 当 然 要 比 具体 其 中 一 种 的 隶属 程度 
来 得 高 。 

定义 6.4 设 4，B 为 集合 S 上 的 两 个 模糊 子 集 ,又 若 对 所 有 
的 zES，U4z) 三 ha《2)， 风 称 和 4 包含 在 8 中 ， 记 为 4 伍 8， 车 
v2€ES,， H(z) = kalz)， 则 称 和 4 与 8 相等 ， 以 A4= 刁 记 之 ， 

于 是 我 们 可 得 和 AU 8B 是 包含 入 ，B8 的 最 小 模糊 子 集 , 和 分 几 8 为 
含 于 4 及 8B 中 的 最 大 模糊 子 集 . . 

由 以 上 我 们 不 难得 到 下 面 一 系列 类 似 普 通 集 合 运 算 的 规 
则 ， 


1, 4U4=A4nA= 人 入 等 等 律 
2. AUB=BUA, ANB=BNA 交换 律 
3. (AUB)UC=AUCBUL) 结合 律 

ANBNEC=ANCBNEK) 结合 律 
4. ANCBUC)= (AN BU ANG) 分 配 律 

AUCBNC)= AU B) NAUC) 分 配 律 
5. 4UC4nB)=4 和 mAL = 条 吸收 律 
6. (AUB)Y=A° NA ,ANB)=A UE 对 偶 公式 
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7。 


(= 站 


复原 律 


我 们 只 举 对 定律 3 结合 律 ) 的 证 明 ， 其 它 可 仿 此 ， 

证 3 这 是 因 对 如 ， 妖 及 & 的 三 个 隶属 函数 4， 如 及 hc， 对 
任何 一 xE 5 的 隶属 程度 为 LxCx) ,haz)，k。《z)， 它 们 之 间 有 下 
列 6 种 情形 : 


1. 


[| 


6. 


WCT) p(T) HL) 


. WaT) pc(T) > Her) 
.aCT)> HT) LA(T) 
. p(t)>AT)> Hc) 
.Uc(T)PLT) HBT) 


Hclr)> LT) LAt) 


我 们 只 举 上 面 六 种 情形 任 一 种 , 设 情形 1 的 时 候 来 证 ， 其 它 
可 仿 此 。 这 时 因为 


所 以 


及 


于 是 


Wa(T)>Ha(T) Hc(T) 
max{Mp(X), Wc(7)}= a(x), 
max{ja(z), Kc(r)}= a(t) 
max{1a(rz), ka(x)}= Har) 
max{Wsx), max{ha(r), Kc(T)}}=hkar) 
=max{max{Js(z), Ha(2)}, KcCr)} 
对 集 S 上 所 有 模糊 子 集 的 全 体 以 F(S)? 表 之 ， 


值得 一 提 的 是 FCs) 不 像 普通 集 的 子 集 全 体 在 普通 集合 运算 
下 形成 一 布尔 代数 ， 因 FCs) 不 满足 互补 律 ， 若 以 疙 表 相 应 


Q 表 相应 


Wz) 二 1 YzES 的 模糊 集 


poCz)=0 VzE5 的 模糊 集 
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CV maxfld(z)，1-ACzD))= 一 1 V7ES 不 一 定 成 立 ) 
(3.1) 


及 Te、 


(人 YU minfkiGrz)，1- AZz))} = 一 0 YYzES 不 一 定 成 立 ) 
(3.2) 


特别 地 ， 如 果 我 们 取 4-{zlucD = 了 则 (3.1) 及 (3.2) 就 
自明 了 。 


4$4 如何 定 出 隶属 函数 


为 了 定 出 一 个 模糊 集 的 隶属 函数 ， 一 个 似乎 自然 的 方法 是 
采用 统计 学 中 的 抽样 平均 值 或 标准 误差 等 理论 来 建造 。 但 不 能 
就 因此 认为 模糊 集 也 不 过 是 概率 或 统计 的 一 种 运用 罢了 。 因 为 
概率 上 的 不 确定 使 事件 的 发 生 具 有 随机 性 ， 但 事件 本 身 是 确定 
的 。 由 于 条 件 的 不 明显 或 不 足 ， 事 件 发 生 与 否 就 有 了 多 种 可 能 
性 .在 [0，1] 上 取 值 的 概率 分 布 函数 就 是 描述 此 种 随机 性 。 而 
模糊 的 不 确定 是 指 元 素 对 集合 〈 或 一 个 概念 或 定义 ) 的 隶属 程 
. 变 的 量度 ， 其 事件 本 身 的 含义 是 不 确定 的 ， 而 事件 发 生 与 否 是 
确定 的 ， 在 [0，1] 上 取 值 的 隶属 函数 就 是 描述 此 种 不 确定 性 ， 
我 们 又 称 之 为 模糊 性 。 但 要 指出 ， 有 些 事件 的 描述 或 表现 具有 
随机 与 模糊 两 性 质 。 如 “明年 九 月 在 合 北 可 能 发 生 强 大 的 地 
震 ”".“ 强 大 ”是 对 地 震 的 一 个 不 确定 的 描述 ,为 一 模糊 的 概念 ， 
而 加 上 明年 九 月 发 生 这 是 对 出 现 地 震 事件 的 不 确定 的 说 法 具有 
随机 性 。 总 之 ， 统 计 是 把 总 结 必然 的 现象 扩大 到 与 偶然 现象 的 
研究 ， 而 模糊 集 是 把 清晰 的 现象 讨论 推展 到 迷糊 的 现象 中 去 . 
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至 今 为 止 ， 除 了 特殊 情形 外 ， 一 般 我 们 还 没有 一 个 理论 性 的 方 
法 来 建造 一 个 模糊 集 的 隶属 函数 。 对 不 同 的 问题 及 概念 ， 我 们 
往往 赁 一 些 直 觉 的 体验 或 经 验 定 出 一 个 适当 的 数学 隶属 函数 式 
子 来 供 使 用 ， 下 面 我 们 举 一 些 例子 ， 说 明 对 一 些 模糊 集 如何 适 
当地 给 出 它们 具体 的 隶属 函数 来 。 

例 6.2 设 S 为 所 有 的 三 角形 的 集合 ， 并 且 我 们 对 相似 三 角 
形 不 加 区 分 ， 所 以 这 时 我 们 依据 三 角形 的 三 个 内 角 来 定义 出 一 
些 模糊 集 如 下 ， 

首先 ， 我 们 可 以 先 按 三 角形 的 三 个 内 角 的 变数 以 x<，B,Y? 记 
之 ， 并 设 0 宇 p 之 7， 因此 S 中 每 一 个 元 素 ( 即 一 个 三 角形 ) 相应 
和 干 一 序 对 t=C@，B，Y)， 所 以 5 又 可 表 为 ， {w=(e, B，?Dle 
+6+Y=180,， 之 B 宇 ?之 0}. 

我 们 现 对 S， 考 虑 三 个 模糊 集 ; 

(1) “近乎 正 三 角形 ”的 模糊 集 EE。 

这 时 我 们 似乎 可 从 许多 不 同 图 形 观察 ， 得 到 一 个 共同 的 印 
象 ， 即 最 大 角 与 最 小 角 的 差 愈 小 ， 则 愈 像 正三 角形 。 因 此 我 们 
不 妨 定 ， 

ea—yY 


te(W) =1- 0 


化 一 素 属 函数 反映 了 当 4 为 一 正三 角形 ，HsCu) =1, 即 不 会 
判断 错误 ， 
(2) “近乎 直角 三 角形 "的 模糊 集 。 


这 时 一 个 如 此 三 角形 的 特征 是 最 大 角度 与 90 之 差 愈 小 ， 则 
愈 像 直 角 三 角形 。 因 此 我 们 不 妨 定义 隶属 函数 如 下 ， 


ual =1- 13 0 p=(a,B,Y) ES 
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《3)“ 近 平等 腰 的 三 角形 ?的 模糊 集 @。 
一 个 三 角形 的 三 内 角 如 有 两 个 角 的 差 愈 小 ， 则 愈 像 等 腰 三 
角形 。 这 时 我 们 不 妨 定 隶属 函数 如 下 ， 


minCg -PB,B-Y) ,og, 8g, WES 


1 一 1 一 
leh) 60 


我 们 也 可 借 上 面 的 模糊 集 看 看 一 些 它们 间 的 逻辑 运算 结 
果 , 设 E，R 及 如 上 面 记述 的 三 个 模糊 集 , 则 么 = 丸 作 忆 表 达 
“ 近 平等 腰 直 有 角 三 角形 ”的 模糊 集 ， 及 

R=(RUKCUE)' 表达 “无 什么 特殊 性 质 的 三 角形 ”的 模 精 
集 。 
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5.1 模糊 分 类 原则 (模型 识别 的 一 方法 ) 
一 般 设 一 个 集 S 上 定 有 1# 个 模糊 集 和 4 ，4:。，…，4,。 现 如 
果 为 S$ 中 的 一 元 素 ， 我 们 要 判定 x。 到 底 归 属于 哪 一 个 模糊 集 
呢 ? 换 句 话 ， 我 们 如 果 想 知道 &, 与 如 ， 双 :，…，4, 中 哪 一 个 
最 近 ? 一 个 自然 而 直 党 的 判断 法 是 比较 ， 叉 :Co)， 人 :Co)， 
和 :CD7，…， 人 (oo) 中 的 值 ， 将 & 归 具 最 大 信 的 集 ， 邯 若 
A1CWo) ~max(A (wu,), 息 , (Wo)， AW )), 则 判定 w, 隶 
属于 41。 
例如 在 前 面 举 的 三 角形 集合 中 ， 共 有 5 个 模糊 集 ， 玉 ， 太 ， 
余 ， 委 及 8， 现 如 S 中 的 一 元 素 4。 = (85,50,45)， 则 由 计算 可 
得 他 Wo) =0.7, 及 (Xe ) 一 0.916， 吕 (ko) 一 0， 94， 和 =0. 916 及 
四 =0.06， 其 中 CCuo)= 0.94 为 最 大 ， 故 按 分 类 原则 ， 宜 判定 
。102 。 


&o 为 近乎 等 腰 三 角形 。 
5.2 符合 变 、 择 近 原 则 及 聚 类 分 析 
上 面 提 的 分 类 是 以 针对 集合 S 中 个 别 元 素来 作 判别 ， 但 在 
普通 一 般 较 实用 及 复杂 的 识别 问题 中 ， 所 要 识别 的 对 象 是 $ 中 
一 个 子 集 〈 普 通 的 或 模糊 的 )。 比 如 对 某 校 所 有 的 学 生 (S) 书 法 
体 “ 像 颜 体 ” 的 形成 一 模糊 子 集 工 “ 像 柳 体 ” 的 形成 一 模糊 子 
集 工 “ 像 于 体 ” 的 也 形成 一 模糊 子 集 苹 ， 现 如 何 比较 此 三 个 模 
糊 集 的 相近 性 呢 ? 这 时 所 要 关注 的 是 两 个 模糊 子 集 间 的 符合 程 
度 。 先 介绍 一 个 定义 如 下 ， 
定义 6.5 设 4， 8 为 集 S 上 的 两 个 模糊 子 集 ， 则 
A°B =max{minCpa (hu), KeCw))} 
ADBB =min{maxCuaCu), haCu)))} 


分 别称 作 和 与 B 的 内 积 及 外 积 。 值 得 提 的 是 此 两 运算 规则 
* 及 外 相当 于 UU 及 个 ， 所 以 不 但 满足 第 3 节 中 的 各 运算 体 ， 生 汪 
足 互补 律 。 

定义 6.6 (符合 度 ) 定 


CA, B)=3[A°B +1~ (A®DB)] 


为 A 与 B 的 符合 程度 . 

在 农作物 品种 改良 时 ， 如 何 判定 新 的 品种 与 旧 有 的 相近 比 
较 、 医 学 上 癌 细 胞 的 识别 及 其 它 名 种 研究 实验 上 都 可 用 到 这 一 
原则 ， 

择 近 原则 

设 S 上 给 出 了 rn 个 模糊 子 集 A ,，A ，……，4, 及 另 一 模糊 子 集 
了 3， 车 有 一 i;，1<<i<n 使 得 
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(了 了， AD)=max( 卫 ， 4,) 
则 称 B( 在 A，， As， “’", 和 :之 中 ) 与 入 :最 符合 。 


本 节 最 后 要 提 的 是 模糊 集 在 聚 类 分 析 上 的 作用 。 

从 数学 上 来 讲 ， 一 个 明确 的 分 类 ， 是 要 由 一 个 等 价 关系 来 
确定 的 (集合 5S 的 一 关系 R 如 果 对 任何 z?，y，z ES， 满 足 C1)xRx 
( 反 身 性 )，(2) 另 要 xRy 就 有 VRx (对 称 性 )，(3) 只 要 xRy 及 
yRz 就 有 XRz (传递 性 )， 就 称 R 为 一 等 价 关 系 。 例如 在 实数 上 
“二 ”的 关系 就 是 一 等 价 关 系 ， 但 “之 ”就 不 是 了 ), 因 此 x，y 等 
价 就 表示 此 两 元 素 在 某 种 意义 下 “相等 ”, 比 如 说 三 角形 的 “ 相 
似 ” 关 系 ， 学 生 间 的 同班 关系 ， 有 了 等 价 关系 就 可 把 原来 的 集 
较 明显 的 分 成 许多 不 相交 的 子 集 。 不同 子 集 就 相应 不 同 的 类 ， 
这 就 叫 聚 类 分 析 ， 但 现实 问题 的 分 类 多 半 随 着 模糊 性 ， 因 此 如 
果 把 大 致 相似 或 相近 的 元 素 合 成 一 类 的 聚 类 概念 ， 也 自然 地 要 
靠 一 种 “模糊 关系 ”概念 来 处 理 了 ,下 面 我 们 就 讨论 此 种 关系 了 ， 


模糊 关系 
大 家 也 许 一 定 记得 当 U、 品 为 两 个 普通 集合 时 ， 两 者 的 管 
卡 儿 乘积 ， 
UxV={(w, 0); WwEU, vEV) 
它 代表 的 是 任何 一 个 U 中 的 元 素 与 任何 一 个 V 中 的 元 素 间 所 有 
可 能 的 配合 。 如 果 我 们 对 这 种 配合 加 了 某 一 种 限制 ， 那 么 这 种 
限制 就 造成 了 U 与 V 间 的 某 种 特殊 关系 ， 反 过 来 说 ,任何 -~ 种 特 
殊 关 系 (或 规则 》 必 相应 有 U xV 的 一 个 子 集 ( 即 我 们 可 以 得 到 
所 有 的 序 对 (wx,，v), 其 中 、v 满 足 所定 的 规则 或 关系 者 ), 对 于 
模糊 集 ， 我 们 也 就 可 以 有 类 似 的 定义 了 。 
定义 6.7 设 U 与 V 为 两 个 集合 〈U、Y 不 一 定 为 不 同 的 集 
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合 )。 记 谓 0 到 V 的 一 个 模糊 关系 是 指 UxV 的 一 个 模糊 子 集 
《注意 因 U xV 亦 为 一 个 集合 ， 所 以 可 以 讨论 它 的 模糊 子 集 ) . 隶 
赂 程度 krCu,Y) 表 示 w 与 "具有 关系 尺 的 程度 ， 

在 U 与 Vy 组 为 有 限 集 时 ， 我 们 往往 可 用 矩阵 来 表示 未 属 程 
度 。 

例 6.3 今 设 5 为 一 组 ?个 小 孩 的 集合 ,，U= (3.5,3.6,3.7， 
3.6, 3,9, 4.0, 4.1), V=(60, 70, 75, 80, 85, 90,95) 
分 别 表示 S 中 小 孩 的 身高 《以 吕 计 )， 及 5 中 小 孩 的 体重 (以 磅 
计 ), 则 U0 与 V 之 间 的 一 个 模糊 于 集 R 的 隶属 程度 可 以 表示 如 下 ， 
《 即 尽 表示 了 身高 <-> 体 重 间 的 一 模糊 对 应 )》 


U 
~ = _  _ 
3,5 1 0.7 0.4 02 0 0) 0 
3.,6 | 0.9 1 0.8 07 0.4 0.2 0 
3,7 | 0.7 0.8 1 0.8 0.7 0.6 0.2 
3,8 10.5 0.7 0.8 1 0.8 0.5 0.3 
3,9 | 0.4 0.5 0.7 08 1 0.8 0.6 
4.0 | 0.2 0.3 0.6 0.8 0.9 1 0.4 | 
4.1 N6 0.2 0.5 07 08 0.9 1) 
此 相应 的 矩阵 又 叫 模糊 什 阵 ， 


有 了 模糊 关系 ， 我 们 也 可 利用 它们 的 模 类 矩阵 定义 它们 间 
的 一 些 运算 (也 即 把 前 面 内 、 外 积 的 定义 推展 到 高 维 空间 而 已 )， 
有 了 模糊 关系 ， 我 们 就 可 定义 模糊 等 价 关系 ， 并 进而 可 定 出 信 
化 度 及 影像 度 等 量度 ， 配 合 模糊 算法 语言 ， 就 可 在 利用 电脑 整 
理 大 批 资料 或 文件 时 ， 能 动态 地 将 所 要 的 资料 一 层 一 层 地 自动 
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滤 出 来 。 

结论 ， 模 糊 集 的 概念 已 是 现代 管理 、 控 制 自动 化 利用 电脑 
操作 中 仿 人 脑 功用 的 数学 理论 根据 。 目 前 它 的 理论 研究 配合 有 
概率 论 、 逻 辑 ， 抽 象 的 拓扑 学 、 代 数学 及 测度 与 空间 理论 的 各 
种 架 式 ， 我 们 在 此 介绍 的 只 是 模糊 论 最 浅显 的 一 面 。 坊 问 已 有 
不 少 此 类 的 专 书 ( 用 英文 写 的 )， 但 在 台湾 似 还 未 看 到 中 文 写 的 
有 关 的 书 ， 和 希望 不 久 就 可 看 到 它 的 出 现 。 


附注 


现在 日 本 工商 业界 已 将 模糊 理论 应 用 在 家 庭 电器 用 品 的 发 
展 及 制造 上 ， 取 得 了 相当 惊人 的 进展 ， 如 日 本 已 出 售 一 种 可 随 
室内 光线 的 明 障 ， 自 动 调节 其 画面 明暗 的 “模糊 电视 机 ”, 该 机 
且 能 随 观 看 电视 的 人 与 画面 的 远近 有 所 改变 ， 会 在 其 音量 上 作 
出 适当 的 调节 , “模糊 洗 碗 机 ”可 视 其 收 进 的 碗 碟 的 脏 度 及 多 少 ， 
来 决定 其 冲洗 的 时 间 、 洗 溪 剂 、 水 量 。 另 外 类 似 的 也 有 所 谓 的 
“模糊 空调 机 ”。 这 一 切 都 说 明 将 来 人 们 对 其 器 具 的 发 明 及 环境 
的 适应 ， 都 要 以 较 精确 (多 层面 ) 的 模糊 理论 来 控制 了 。 
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第 七 章 ”机 率 程式 与 随机 数 


中 


$1 前 


一 般 计算 机 程式 都 是 一 步 接着 一 步 ， 什 么 样 的 输入 ， 一 定 
会 产生 什么 样 的 作业 运转 及 什么 样 的 给 出， 不 论 在 铀 里 跑 这 个 
程式 的 进行 及 结果 都 该 是 一 样 。 

机 率 程式 (probabilistic algorithm) 的 意思 是 指 程式 中 含 
有 不 确定 的 元 素 ， 造 成 运转 并 非 一 成 不 变 ， 同 样 的 输入 ， 可 以 
产生 不 同 的 运算 ， 但 结果 仍然 是 所 要 求 的 结果 。 基 本 就 来 ， 这 
种 程式 设计 往往 用 到 统计 学 的 原理 ， 在 某 种 情形 下 ， 我 们 若 对 
输入 资料 的 结构 有 相当 的 了 解 ,就 可 以 大 大 的 节省 计算 的 时 间 ， 
先 举 一 个 简单 的 例子 。 

假定 我 们 有 十 万 个 缴 税 单 在 磁 碟 中 ， 我 们 要 取出 前 面 一 千 
个 最 高 额 的 税 户 ， 一 个 直觉 的 方法 就 是 先 取 最 高 税 户 ， 再 取 次 
高 税 户 ，…， 一 直 取 到 第 一 千 个 高 税 户 为 止 ， 如 何 找 到 最 高 税 
户 ? 我 们 必需 将 所 有 的 税额 都 互相 比较 过 《人 少 一 户 都 不 行 ) ,我 
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们 若 每 次 比较 都 取 大 户 再 往 下 比 ,要 比 9999 次 ,一 次 也 少不了 ， 
车 再 往 下 去 ， 我 们 得 比 9998 次 去 找到 第 二 大 户 ，…，。 若 令 
NN =100000， 则 找到 n= 1000 最 高 税 户 的 总 比较 次 数 是 

S=(N-1)+CN-2) + +(N-n)=nN-nn+1)/2 
因 N 比 x 大 得 很 多 ， 故 SnN =10s。 

但 是 如 果 我 们 知道 至 少 有 1000 户 的 税额 大 于 M= 200000 
元 ， 则 我 们 可 以 先 把 所 有 的 税 与 M 比 较 ， 凡 是 小 于 M 的 税额 就 
不 必 再 用 ， 这 时 我 们 用 了 N 个 比较 ,假定 我 们 发 现 有 NN =2000 
个 税 户 大 于 M， 那 么 我 们 现在 再 在 这 N' 户头 中 找 一 千 个 最 大 
户 ， 车 用 刚才 同样 的 方法 ， 则 我 们 需要 

S/’~nN’~nn+1)/2~1.5x 10° 

个 比较 ,再 加 上 原先 的 N= 105 个 比较 ,全 部 的 比较 是 1.6x 10"， 
是 原先 S= 108 的 六 十 二 点 五 分 之 一 ， 相 当 于 一 分 钟 与 一 小 时 计 
算 之 差 。 

不 过 在 实际 作业 中 ， 我 们 可 能 不 知道 M， 因 此 们 我 必须 要 
有 一 个 方法 来 猜测 M 之 值 ， 我 们 所 希望 的 M 是 指 一 千 个 大 户 的 
下 限 ， 我 们 可 以 定 它 为 从 最 高 额 向 下 数 第 一 千 个 大 户 的 税额， 
目前 测定 M 最 好 的 方法 是 有 统计 抽样 的 方法 ， 即 在 原 数据 中 抽 
出 车 干 样 本 ， 用 样本 的 分 布 情形 来 估计 M。 直 觉 上 ， 我 们 可 用 
样本 的 前 百 分 之 一 (n/N) 的 下 限 M 作为 M， 但 我 们 又 可 以 觉察 
到 这 个 M “大 于 M 与 小 于 M 的 机 会 像 是 一 半 一 半 ， 因 此 有 一 半 
的 可 能 大 于 M 的 户头 小 于 一 千 ， 那 么 先 取 所 有 大 于 M 的 户头 
的 方法 就 不 能 产生 一 千 个 大 户 ， 因 此 我 们 不 妨 保守 一 点 ， 用 样 
本 的 百 分 之 二 的 下 限 必 为 M 之 估计 值 ， 现 在 我 们 要 问 在 原 数 据 
中 大 于 站 者 约 有 和 多少? 要 求 出 这 个 值 ， 我 们 必须 知道 原来 的 抽 
样 是 随机 抽样 ， 即 每 个 税 户 都 有 相同 的 机 会 (n/N) 被 抽 到 。 

设 原 数 据 中 没有 重复 ， 因 此 我 们 可 以 令 所 有 的 数据 为 
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Pi 


TT ) Ts) TN (1) 
则 大 于 让 的 税 户 为 i 户 ， 即 斤 =,;,， 其 或 然 率 为 


lvN-i 
px = es) 
(Cr ) 
式 中 4=1000， 即 抽样 之 量 ，!% = 20 即 样本 之 前 百 分 之 二 十 ， 


若是 M>>X,， 我 们 的 目的 就 达到 了 (因为 着 以 M 为 下 限 ， 
所 有 大 于 M 的 数据 大 于 #= 1000)， 其 或 然 率 为 


y - (y21) (ny) 
p=P,(M>X.,} 一 2 N 
(1) 
这 个 或 然 率 值 不 太 容 易 计 算 ， 但 若 用 比较 高 深 数学 上 的 近似 公 
式 可 得 D 汪 0.9992, 也 就 是 说 如 果 用 M 为 下 限 而 取 所 有 大 于 M 的 
数据 ， 但 其 中 含 不 到 一 千 个 最 大 的 税 户 的 机 率 是 微乎其微 
(=1~?=0.0008). 
当然 有 可 能 M 比 M 小 得 很 多 ， 在 这 种 情形 下 的 M 就 不 算 对 
M 很 有 效 的 估计 ， 但 无 论 如 何 M 不 太 可 能 很 小 ， 因 此 应 该 比 不 
知道 M 好 ， 在 此 我 们 不 去 讨论 M 与 M 之 间 关系 的 细节 ， 只 想 说 
明 我 们 有 可 能 测定 M 及 用 测定 的 M 值 来 节省 计算 的 时 间 ， 因 每 
次 抽样 的 结果 并 不 相同 ， 程 式 运转 的 情形 也 不 尽 相同 ， 但 所 这 
到 的 目的 是 相同 的 ， 


$ 2 快速 编排 


编排 是 指 把 数据 依 某 一 指定 的 次 序 排列 ， 俩 如 电话 号 码 饼 
按 姓名 笔划 排 ， 联 考 成 绩 按 总 分 多 少 排 。 编 排 的 程序 在 计算 机 
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程序 中 占 重要 的 地 位 ， 因 为 它 与 寻找 一 个 指定 的 数据 有 密切 的 
关系 。 试 想 车 电话 号 码 铸 不 按 姓名 笔划 排 ， 虽 要 找 一 个 人 的 电 
话 是 何等 的 困难 ， 又 如 上 节 的 例子 ， 如 果 税 单 是 照 税额 大 小 排 
的 ， 则 我 们 很 容易 找到 第 十 号 大 税 户 ， 否 则 就 要 排 很 多 次 才能 
找到 ; 由 于 数据 不 断 的 更 新 ,计算 机 内 的 资料 需要 不 断 的 编排 ， 
因此 几乎 所 有 计算 机 程式 中 都 有 一 个 编排 程式 ， 而 其 中 最 常用 
的 叫做 快速 编排 (quick sorting)， 是 Hoare 在 1962 年 发 现 的 。 

快速 编排 的 原理 与 上 节 所 讨论 的 抽样 法 相似 ,但 比较 简单 。 

现 假定 我 们 有 2 个 不 相同 的 数据 ,我 们 要 把 它们 按 大 小 排 起 
来 ， 刚 才 说 的 直 党 方法 是 先 比较 人 2 一 1)， 次 找 最 大 的 ， 再 比较 


(人 -~ 2)， 次 找 次 大 的 ，…， 一 直到 比较 了 
了 = 人 -1)+(0 一 27+…+3+2+1 
=n(n~1)/2 守 nn /2 (2) 


次 之 后 ， 就 编排 完成 。 

现在 假定 我 们 知道 这 组 数据 的 中 间 值 〈 即 一 半 比 此 数 大 ， 
一 半 比 此 数 小 ), 则 我 们 可 以 先 将 每 个 数据 与 此 数 比 较 ， 车 小 于 
它 ， 放 在 一 堆 ， 大 于 它 的 放 在 另 一 堆 ， 这 样 一 共用 了 约 4 个 比 
较 , 然 后 再 用 前 面 的 方法 色 大 小 两 堆 分 别 按 大 小 绢 排 再 合 起 来 ， 
很 显然 的 ， 我 们 用 了 

名 十 20(8]/272/12) 一 如 二 42 /4 (3) 

个 比较 ， 上 式 中 (各) /2 是 大 小 两 半 编 排 时 所 需 用 的 比较 数 ， 
因 有 二 半 所 以 乘 以 2 ， 比 较 C2) 式 与 (3) 式 ， 可 知 在 n 很 大 时 ， 
n+n2/4 守 #2/4， 省 了 几乎 一 半 的 时 间 ， 以 此 类 推 ,我 们 若 又 能 
知道 上 半 或 下 半 的 中 间 值 ， 我 们 又 可 以 省 一 半 的 时 间 ， 

现在 问题 是 如 何 找到 这 个 中 间 值 ， 根 据 上 节 的 想法 ， 我 们 
可 以 取 一 个 样本 ， 用 以 测定 中 间 值 ， 取 多 少 样本 ? Hoare 的 奸 
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议 是 取 一 个 样本 ， 直 党 上 看 来 这 个 样本 实在 太 小 。 但 出 乎 意料 
之 外 的 ， 这 还 是 目前 最 好 的 办 法 ， 有 人 曾经 想 加 大 样本 以 对 中 
间 值 作 更 精确 的 估计 ， 但 结果 因 程 式 变 得 更 复杂 ，、 并 不 能 节省 
什么 计算 时 间 。 因 此 大 家 仍 用 Hoare 的 方法 随便 取 一 个 值 做 中 
间 值 ， 

因 机 率 程式 的 运转 与 抽出 的 中 间 值 有 关 运 转 的 时 间 就 不 是 
一 个 定数 ， 一 般 我 们 要 考虑 二 种 情形 ， 

一 、 运 转 时 间 的 平均 值 (期 望 值 )， 

二 、 在 最 坏 的 情形 下 ， 运 转 的 时 间 ， 
其 中 第 二 种 情形 是 要 防止 在 最 坏 的 情形 下 ， 程 式 不 会 永远 跑 不 
ZL。 

在 编排 程式 中 ， 运 转 时 间 几 乎 与 比较 次 数 成 正比 ， 因 此 我 
们 就 以 比较 的 次 数 来 计算 运转 时 间 ， 先 看 期 望 值 。 在 快速 编排 
中 ， 令 

SGD) = 一 组 含 ?个 不 同 数据 用 Hoare 方法 所 需 之 平均 比较 

次 数 

用 (1) 式 之 符号 ， 我 们 有 相同 的 机 会 (1 到 工 人 1 2 
1 为 中 间 值 ， 设 我 们 取出 之 值 为 m11，， 则 原 数 据 被 分 为 m 与 
1 一 m 一 1 两 部 分 ， 故 


1 ni 
SC =n-1+ {Sm) + Sn-m--1)} (4) 


上 式 中 ~ 1 是 指 剩 下 的 4 -1 个 数 与 中 间 值 《估计 的 ) 下 (1, 相 
比较 以 分 开 成 小 于 Xml， 的 集团 〈 含 m 个 数据 ) 及 大 于 XX 41， 
的 集团 ( 含 8 ~m -1 个 数据 ) 的 比较 次 数 ， 

式 (4) 很 容易 写成 


S(n) = 1+ DSCm) C5) 
m0 


Til。 


办 一 并 


1 SH) + SCm) 《6) 
m=0 


将 上 式 最 后 ~: 项 代入 (5) 式 的 另 一 个 形式 


no--l 


SCm) =ntSCn) -Cn—1)]/2 


可 得 
SG -SCI 4 .2 (7) 
+ nn nt] 和 
将 (7) 式 … 直 代 下 去 可 得 
S(n) _ SC(n~2) 1 1 \ _ 1 1 
n+l1 nn-l + 人 (二 可 2( ) 


SD (Lrl+e til) 


2 4 名 十 工 
1 1 1 
一 2 到 + 可 + 和 + 二) 
SC1) 显然 为 0， 著 包 In(2) 表 4 之 自然 对 数 ， 刚 一 个 有 名 的 公式 
1+ t+ite+ Lo0.577+1nCn) 
2 3 
可 使 得 
SR) , _ 
Tn +1)+0.577 ~ 3/2) 
~2(ln(n) +0.577 一 1) 
即 


SCR)=2nlnCn) C8) 
所 以 我 们 的 结论 是 快速 编排 平均 要 用 2nlinCm) 个 比较 ， 在 sx 很 大 
的 时 候 2rnln(n) 与 %* /2 相差 极 大 ， 上 比如 说 #=10°, 即 一 百 万 个 数 
据 ， 则 
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2#ln(8) 一 27.6X 10°, #2/2=5x10!! 
车 一 个 计算 机 每 秒 可 以 比较 10* 次 ， 则 上 两 项 欧 时 差 是 27 .6 秒 
与 五 天 十 九 小 时 。 

快速 编排 最 坏 的 情形 是 每 次 都 选 到 最 大 的 或 最 小 的 做 中 间 
值 ， 在 这 种 情形 下 ， 等 于 没有 分 ， 读 者 可 以 很 容易 求 出 其 所 需 
之 比较 次 数 与 (2) 式 相同 ， 但 其 可 能 性 为 

辫 s( 笃 ) (9) 

式 中 e 为 自然 对 数 的 底 ， 只 要 n 稍 微 大 一 点 ,C9) 式 所 表示 的 或 然 
率 可 以 说 是 不 可 能 。 

我 们 曾 用 小 电子 计算 机 作 了 一 个 实验 ， 在 实验 时 我 们 写 
了 两 个 程式 ， 一 是 先 取 最 大 ， 再 取 次 大 的 直觉 方法 ， 称 之 为 逐 
次 编排 ， 另 外 是 快速 编排 ， 在 表 1 中 有 当 *= 100 及 500 的 编排 时 


间 ， 及 与 理论 值 (n*/2) 及 C2n1ln(#)) 的 比较 。 
宕 1 两 种 编排 的 比较 


em 


nn ”快速 编排 逐次 编排 快 排 pi 2nIn(8))》 逐 排 /(127/2) 


《〈 秒 ) ( 秒 ) 
100 6 25 0.0065 0.005 
500 38 620 0.0061 0.005 


可 见 我 们 的 预计 值 (x*/2) 及 C2nlnCw)) 相 当 的 正确 ,其 中 比 
值 有 0.0065 及 0.005 之 差 ， 表 明快 排 的 程式 较 逐 排 为 复杂 ,所 用 
的 非 比较 运算 较 多 ， 

快速 编排 是 否 可 以 改进 ? 管 案 是 还 可 以 ,但 进步 不 了 多 少 ， 
原因 是 这 样 一 个 直觉 的 定理 (并 不 容易 证 明 )， 即 比较 一 次 只 可 
以 辨别 一 个 元 素 属 于 二 个 子 集中 的 一 个 ， 举 一 个 例子 ， 如 果 有 
一 数 z， 我 们 若 把 它 与 50 比 较 ,我 们 只 知道 它 是 大 于 50 或 小 于 等 
于 50， 不 可 能 确 知 z 是 何 数 ， 但 如 果 一 个 集合 中 只 有 两 个 元 素 ， 
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一 个 大 于 50， 一 个 小 于 50， 则 只 要 比较 一 次 就 可 知道 x 是 哪 一 
个 元 素 ， 但 若 某 集 含 4 中 有 三 个 元 素 ， 则 不 能 比 一 次 就 可 确 知 
4 中 的 某 一 元 素 z, 必须 比较 两 次 ， 依 此 类 推 可 以 知道 。 
定理 。” 若 A 中 含有 hk 个 元 素 , 则 至 少 要 比较 log:k 次 才 可 以 确 
知 zE A 是 哪 一 个 元 素 。 
编排 * 个 数据 ， 相 当 于 知道 原来 * 个 数据 的 排列 , 因 ? 个 元 素 
有 1 种 排列 法 ， 故 至 少 要 用 
Sa 一 log:(Cz1) 
次 比较 ， 用 Stirling 公 式 %!1 渤 v5NN re 可 知 
Snmia=10g,(n!1) Tnlogs,n ~ nlogse nlog,tn 
=1.38nln(Cn) (10) 
将 (10) 与 (8) 比 较 可 知 Sno 与 (1%) 的 差别 已 不 算 大 ,因此 除非 有 
一 个 相当 简单 的 方法 ， 就 不 值得 用 来 代 疹 Hoare 的 快速 编排 。 


83 随机 数 


在 上 节 谈 到 的 Hoare 方 法 中 我 们 需要 在 (1，2，…， 和 个 元 
素 中 任意 取 一 个 ， 如 何 任意 取 ? 照 定义 ， 即 是 任何 一 个 数 都 有 
1/n 的 机 会 被 取 到 ， 设 我 们 可 以 找到 一 个 在 C0,1) 之 间 的 随机 数 
U， 它 在 (0，1) 区 闻 均 匀 分 布 着 ， 即 

P,{a<U<b}=6- | (11) 


那么 我 们 取 一 个 0， 若 0<U< 二 二 取 1, 一 LU< 2 所 
0 <S 二 到， GD cc 则 每 个 数字 1，…， 
都 有 二 的 机 会 被 取出 。 一 个 较 简 音 的 分 配 法 ,是 令 [z] 表 示 不 小 
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了 于 2 的 最 大 正 整 数 ， 即 [1.5]=1，[2.6]=2，[3]=3， 则 在 1， 
2，…，2# 所 取 的 随机 整数 可 用 
J=[nU+1] 
随机 数 除 了 (11) 式 的 要 求 外 ， 尚 需要 所 产生 一 连 串 的 随机 
数 之 间 为 互相 独立 ， 若 我 们 产生 了 两 个 随机 数 U; ,VU 则 必须 有 
P,{a1 <U,<b, Ba,<U ,<b,} 
=P,{a1 <U, <b}P, (las <U, <b,} 
换言之 ， 

你 给 了 我 0 ， 我 不 可 能 用 它 来 预测 U ,， 

几 计 算 机 来 产生 随机 数 必须 有 一 个 程式 . 但 有 了 一 个 固定 
的 程式 ， 随 机 数 都 定 了 。 当 然 在 理论 上 已 不 成 为 随机 了 ,但 因 
为 对 不 知 该 程式 的 人 而 言 ， 看 了 这 个 数 预 测 不 到 下 个 数 就 算 可 
以 了 。 当 然 要 严格 地 讲 起 来 ， 这 些 只 能 算是 人 造 随机 数 。 

产生 随机 数 的 方法 之 一 像 轮 盘 赌 中 轮 盘 摇 出 的 号 码 ， 当 你 
把 轮 盘 一 转 ， 无 法 预测 指针 会 停 在 什么 位 置 ， 因 为 用 力 只 要 差 
一 点 ， 停 止 的 位 置 就 会 差 得 很 多 ， 轮 盘 转 一 图 又 回头 了 ， 这 就 
相当 于 整数 论 中 的 同 余 观 念 ， 如 果 一 个 轮 盘 分 100 格 ， 那 么 101 
格 就 与 第 1 格 相 重合 了 ， 因 此 在 同 余 的 观念 下 ， 对 100 而 言 

121 三 21，1156 三 56 
我 们 用 (mod 100) 作 记号 ， 即 

X=Y(mod m) 
表示 六 为 Y 除 以 m 的 余数 ，0 声 站 之 m， 一 般 产 生 随机 数 的 方法 
足 取 三 个 正 整 数 o、c 与 m， 用 

1 三 a1_ + C(mod m), R=]1, 2, '** 
重复 产生 I,。 当 然 我 们 需要 一 个 开始 的 种 子 数 I。( 这 可 任意 取 
定 的 )， 而 随机 数 即 定 为 

U,=1,/m 
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在 此 要 注意 的 是 a、m、c 不 可 以 随便 取 ， 要 经 过 多 次 实验 
合乎 随机 的 要 求 ， 像 BM/370 所 用 的 是 4=75=16807，C=0， 
m= 21 一 1， 一 般 小 计算 机 现在 都 有 自己 的 随机 数 程式 ， 其 至 
小 的 科学 计算 器 也 有 随机 数 的 程式 ， 若 要 自己 产生 随机 数 ， 下 
面 三 个 数 可 以 用 
a=25173, C=13849, m=65536 

随机 数 的 另 一 用 途 是 做 含有 或 然 事件 的 模拟 实验 ， 举 一 个 
例子 ， 现 在 世界 少 、 青 少 及 青 棒球 赛 都 采取 双 淘 汰 制 ， 设 现在 
四 队 ， 各 队 互 相 之 间 的 相对 实力 如 表 2 所 示 ， 表 中 数字 表示 上 


队 〈 阿 拉 伯 数字 ?取胜 直 队 (中 文 数字 ?的 或 然 率 ， 举 例 而 富 ， 二 
表 2 


| | 
| 


一 0.6 0.4 


二 | 0.7 | 0.4 


三 0.3 
1 


队 胜 一 队 的 或 然 率 为 0.6， 三 耻 胜 二 队 的 或 然 率 为 0.7， 若 要 根 
据 表 2 去 计算 各 队 赢 得 冠军 的 或 然 率 非常 困难 ,但 我 们 可 以 作 一 
个 模拟 实验 ， 即 每 次 比赛 时 取 一 个 随机 数 ,来 决定 两 队 的 输赢 ， 
比如 二 队 同 一 队 打 球 ， 我 们 先 订 取 一 随机 数 ， 若 此 数 在 0 到 0.4 
之 闻 算 一 队 赢 ， 否 则 二 队 赢 ， 这 就 符合 了 二 队 胜 一 队 或 然 率 为 
0.6 的 要 求 ， 现 在 我 们 就 取 一 随机 数 就 可 以 定 两 队 的 输赢 ,用 计 
算 机 ， 全 部 的 球赛 一 下 子 就 打 完 了 ， 我 们 就 知道 谁 是 冠军 ， 我 
们 可 以 打 一 千 次 或 一 万 次 ， 看 看 各 队 得 冠军 的 数目 ， 也 就 推测 
出 了 各 队 得 冠军 的 或 然 率 。 

现代 有 许多 决策 都 与 不 可 预测 的 事件 有 关 ， 像 台风 、 地 震 、 
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火灾 、 车 祸 等 等 ， 但 我 们 往往 知道 这 些 事件 发 生 的 或 然 率 ， 那 
么 我 们 就 可 以 做 模拟 实验 ， 看 看 我 们 决策 成 功 的 可 能 性 ， 带 有 
随机 数 的 模拟 实验 已 是 现在 许多 行业 中 不 可 少 的 工具 了 。 


§4 结 论 


计算 机 日 益 普遍 ， 因 此 也 产生 了 很 多 有 关 计 算 机 的 笑话 及 
漫画 ， 也 有 人 把 一 切 责 任 推 到 计算 机 身上 ,我 们 常 听 到 有 人 说 ， 
“这 不 是 我 的 错 ， 计 算 机 打出 这 样 的 结果 ， 我 有 什么 办 法 ?”，, 其 
实 计算 机 只 能 做 人 所 教 它 做 的 ， 一 点 也 不 多 ， 一 点 也 不 少 ， 这 
是 计算 机 的 优点 ， 但 也 是 计算 机 的 缺点 ， 计 算 机 没有 创造 性 。 
有 人 说 ， 如 果 有 人 能 教 计算 机 写 出 一 些 笑 话 ， “人工 智 慧 ”《〈 或 
人 工 智能 ) 就 成 功 了 ， 这 话 十 分 有 道理 ， 笑 话 都 是 一 种 预料 不 
到 的 结果 或 结论 ， 若 一 切 都 在 预料 之 中 ， 我 们 就 不 会 有 笑话 的 
感觉 了 ， 

我 们 相信 用 计算 机 写 笑 话 一 定 与 机 率 程式 有 关 ， 即 程式 运 
转 中 含有 写 程 式 者 不 能 预料 的 结果 ， 使 你 不 得 不 大 蚂 这 个 程式 
真是 高 明 ， 我 们 也 相信 在 人 类 的 思维 中 ， 也 有 一 种 不 可 确定 的 
路 径 ， 东 冲 西 撞 ， 一 条 新 的 定理 或 笑话 就 出 现 了 ， 但 这 种 不 可 
预定 的 尝试 似乎 又 不 是 乱 冲 乱 撞 ， 像 是 在 不 可 预料 的 乱 撞 中 有 
一 个 次 序 , 到 底 是 什么 回 事 , 可 以 说 是 人 类 未 来 最 有 趣 的 挑战 ， 


*。1T7。 


第 八 章 ” 电 传 签字 


81 前 言 


到 现在 为 止 一 般 人 在 合约 或 公文 ， 或 支票 上 的 签字 及 图 章 
来 作为 当事人 的 签署 保证 。 但 这 往往 要 靠 对 方 用 眼睛 及 查 对 档 
案 来 肯定 其 真实 性 ， 这 不 是 很 可 秆 的 。 何 况 图 章 及 签字 都 可 伪 
造 仿真 的 〈 事 实 上 就 是 同 个 人 的 签字 也 每 次 都 稍 有 不 同 !)。 
所 以 照 目 前 一 般 防 范 伪 造 及 冒名 签字 的 技术 来 讲 ， 要 想 确定 一 
个 经 过 电 传 的 信息 是 否 由 信 中 所 自称 发 信 的 人 所 拍 发 更 是 难 上 
加 难 的 现实 问题 了 。 当 然 ， 如 时 间 及 环境 许可 ， 一 些 重 大 的 交 
易 或 极 机 密 的 指示 可 以 借助 电话 的 联系 作 沟 道 ， 或 再 拍 送 电讯 
请 对 方 当场 再 作 保证 ， 或 由 密语 来 肯定 。 但 这 种 往返 的 鉴定 ， 
不 符合 现时 代 商 业 上 的 交易 (或 军事 上 的 行动 指示 ), 其 讲求 快 
速 及 保密 的 原则 ， 所 幸 现 有 了 我 们 在 先前 的 -- 些 章节 介绍 利用 
电脑 来 计算 的 公开 密码 的 原理 及 其 长 处 。 发 现 它 也 可 用 来 作 电 
传 签字 的 鉴定 ， 此 方法 当然 也 有 被 冒 签 的 可 能 ， 但 其 可 能 性 非 
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常 的 泪 少 ， 不 幸 的 是 这 种 鉴定 法 也 有 缺点 ， 即 它 尚 不 能 普及 地 
施用 ， 只 有 人 少数 大 银行 或 情报 机 构 有 能 力 来 进行 这 种 电 传 签字 
的 技术 及 鉴定 ， 但 其 理论 仍 是 很 值得 玩味 的 。 


$ 2 ”公开 密码 原理 的 回顾 


公开 密码 有 若干 不 同 的 形式 (请 参看 第 二 章 )。 其 中 之 一 是 
利用 一 个 大 的 合成 数 mm 来 作为 发 码 的 模 数 , 通常 由 是 取 为 两 个 很 
大 质数 p、4 的 乘积 ， 即 

m=pxgq (1) 
目前 的 实用 上 通常 取 p、9g 至 少 为 50 位 数 ， 因 此 m 也 就 近 至 少 为 
一 个 100 位 数 了 ,前 面 我 们 也 曾 指 出 在 目前 电脑 计算 速度 及 能 力 
的 限制 下 ， 蚌 不 可 能 在 儿 年 内 做 到 将 mm 的 因子 找 出 来 的 (除非 m 
具有 特别 的 形式 !1)。 

对 mm 我 们 相应 有 一 个 尤 拉 数 %CmD) 是 指 所 有 小 于 六 而 与 产 豆 
质 ( 包 括 1》 的 正 整数 的 数 且 ， 特 别 当 严 = 2，P、4 为 质数 时 ， 
gCm)==《p 一 1)(q ~1)， 现 公开 码 需 要 一 个 发 码 指 数 4 及 一 个 解 
码 指数 dg， 通常 6 是 取 一 个 相当 大 的 数 ， 但 与 尼 m) 互 质 , 且 不 大 
于 了 及 4， 即 


(Ca, $m))=1, a<p, a<q (2) 
以 下 以 @ 表 四 ma )。 
而 d 是 相应 a 满足 
da=] (mod 0) (3) 
的 一 正 数 。 由 上 式 子 可 得 
d=a"-ICmodow) (4) 


这 个 数 d 是 要 保密 的 ， 也 假设 只 有 收 方 知道 的 一 个 数 ! 
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(m, a) (5) 
称 为 拍 码 钥 ， 这 是 公开 的 。 所 谓 公开 密码 是 拍 送 电码 的 一 方 甲 
在 拍 发 电码 给 要 收 的 一 方 乙 时 ， 不 必 对 其 所 要 发 出 的 电码 保 
密 。 甲 只 要 照 收 方 乙 预先 发 布 的 朱 码 组 ， 把 要 拍 的 数码 M 以 

E=M° (modm) (6) 
公开 好 拍 送 到 收 方 乙 ， 当 乙 收 到 后 就 只 有 他 本 人 知道 的 解码 指 
数 4， 对 正 进行 解码 (或 译 码 )， 其 方法 如 下 ， 
计算 EB 

Es:=(M° y=M" =M’°M+!(mod m) (7) 
(… dd=1 (mod 0) 一 >ad=1+ hw，h 六 一 整数 ) 

但 由 Euler 定 理 
“三 1 (mod m) 
故 (7) 式 可 导 至 

E’=M(mod m) 

于 是 乙 收 到 甲 拍 出 的 数码 M 了 。 

所 以 除非 有 乙方 的 解码 指数 d， 要 将 E 解 回 得 M 几 乎 是 不 可 
能 的 ， 而 要 想 试 得 d 根 据 (4), 必 须知 道 o, 即 @=(P-1)(9-1)， 
也 即 p 及 4， 现 虽然 我 们 知 m( = pq), 但 要 在 短 时 间 内 将 mm 分 解 出 
p、9 两 因子 是 几乎 不 可 能 的 ， 这 也 是 以 上 所 用 的 公开 密码 的 关 
键 。 


8$ 3 电 传 签字 系统 


我 们 这 站 的 电 传 签字 ， 就 是 甲 在 信息 中 ( 提 及 自己 名 字 ) 在 
信息 尾 端 附 上 代表 其 姓名 (或 加 上 住址 、 或 机 关 、 行 号 ) 的 数码 
〈 这 是 公开 的 ), 但 甲 利用 其 解码 指数 将 此 数码 加 以 重新 编码 ( 签 
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字 )， 然 后 照 收 方 乙 公开 公布 的 发 码 组 ， 把 信息 (包括 签字 )〉 重 
新 编 拍 给 对 方 乙 。 在 乙 收 到 信息 后 ， 先 用 其 自己 的 解码 指数 解 
出 信息 ， 如 乙 发 现 其 中 提 了 甲 的 名 字 就 知道 信 足 的 数码 为 姓名 
的 签字 了 。 这 时 乙方 就 用 甲 公开 的 发 码 组 的 发 码 指数 对 电 传 的 
签字 (数码 ) 作 鉴定 ， 看 是 否 和 信 中 所 提 的 甲 的 姓名 相符 。 这 就 
是 电 传 答 字 的 鉴定 了 ，。 

现 我 们 看 电 传 签字 的 一 例子 及 数学 理论 过 程 。 

设 有 一 个 人 甲 在 外 远离 其 银行 乙 所 在 地 ， 急 需 乙 汇 寄 一 大 
笔 钱 。 设 甲 的 公开 发 码 为 (oo，mo)，do 为 其 解码 指数，(al， 
名 字 N) 并 在 信息 后 把 他 姓名 数码 N 作 了 签字 ， 即 数码 

T=N"(mod m, ) (8) 
将 此 附 在 信息 数码 M( 其 中 提 及 甲 的 姓名 N1) 之 后 ， 照 乙方 的 发 
码 组 (这 是 公开 的 ) 作 

[MUT]"=[MJ"'UT®: 
柏 送 到 乙方 。 在 乙 收 到 后 用 其 解码 数码 d,， 先 解 得 

(MUTY =(MUT) (mod m.) 
知 甲 担 了 自己 的 姓名 ( 因 M 中 提 及 甲 的 姓名 )， 于 是 知 信息 来 端 
所 剩 的 数码 7 为 甲 签字 的 电 传 数码 ， 对 此 施用 甲 公 布 的 发 码 组 
中 的 a。 作 鉴定 

T"=Ni=sN (modm,) (9) 

* aody] (modm,) 

这 样 验证 的 确 是 甲 的 签字 ， 因 为 具有 甲 本 人 才 会 签 N ,其 也 具 
可 能 用 甲 的 发 码 组 中 的 ao 解 回 得 N， 


研究 问题 
最 近 我 们 想到 下 面 一 个 可 能 的 电 传 签字 冒 签 的 问题 ， 
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问题 ， 假设 有 人 中 途 截获 (或 银行 职员 ， 或 第 三 者 ) 甲 的 一 
封 电 讯 中 ,由 于 知 里 的 信 中 信和 忆 的 数字 TC = N4 ) 为 甲 名 字 和 的 签 
名 ， 所 以 第 三 者 可 照 用 此 数字 就 可 仿 签 围 的 电 传 签字 了 . 

我 们 也 有 个 方法 来 防止 这 种 情形 发 生 ,但 留待 读者 去 思考 ， 
去 解决 这 -~ 有 趣 的 问题 。 


下 
参考 资料 
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第 九 章 ” 电 传 打 峙 


$1 前 


中 


中 国人 剩余 定理 也 就 是 当今 中 外 数论 书 上 对 我 们 中 国人 老 
祖先 的 “韩信 和 点 兵 术 ”或 “孙子 算 经 ”中 的 “ 物 不 知 数 ” 的 算 
法 ， 及 “ 九 章 算术 ”中 的 大 衍 求 一 算 的 基本 理论 。 用 现代 术语 
就 是 求 一 次 同 余 方 程 组 解 的 主要 理论 ， 这 个 古老 的 数学 计算 法 
除了 对 数学 其 它 分 支 上 的 应 用 外 ， 较 显著 的 是 在 今天 最 尖端 的 
数学 科技 产品 电脑 中 计算 量 理 论 ,发挥 了 相当 大 的 功效 。 在 [1 
中 ， 我 们 也 较 完整 地 介绍 了 此 一 理论 及 它 在 电 传 公开 密码 上 的 
应 用 。 现 我 们 再 介绍 此 理论 在 一 个 性 质 相似 的 “ 电 传 打赌 ”的 
有 趣 应 用 .通常 两 个 人 ( 甲 、 乙 ) 打 赌 ， 常 喜欢 用 猜 铀 板 正 、 反 
面 来 定 答 赢 。 即 一 个 人 卷 铜板 (或 用 手 握 住 ) 由 对 方 犹 正 、 反 。 
这 种 情形 是 两 人 面对面 ， 看 着 搁 出 的 是 正 、 反 面 ， 所 以 设 有 什 
么 可 骗 人 的 (但 可 要 赖 ， 明 明 猜 的 是 “正面 ”到 时 赖 说 猜 的 是 
“反面 "7 。 如 何 把 这 种 性 质 的 “打赌 ”用 电 传 通讯 的 方式 (如 打 
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电话 、 电 报 )》 来 进行 呢 ? 首先 我 们 把 这 种 “打赌 "用 一 个 模式 

来 表示 ， 

随意 下 一 个 正 整 数 <( 数 
码 ) 


z 编 成 另 一 数码 mh | 乙 收 到 教 码 员 后 经 反 演算 
猜 z 或 Y | 可 得 两 个 数码 x，Y 
CE 


| (事实 上 二 x*， 土 9) 


图 11 


当 甲 收 到 乙 猜 的 z 或 4 时， 特别 当 乙 猜 了 2 甲 告 诉 乙 说 “你 
输 了 ”, 在 没 照 相 及 第 三 者 的 旁证 下 , 怎 可 能 心悦诚服 地 认 了 呢 ? 
这 是 本 文 在 下 面 要 解说 的 ， 为 了 方便 读者 的 阅读 ， 我 们 先 把 要 
用 到 的 类 数理 论 ( 有 关中 国人 剩余 定理 及 其 推广 ) 作 一 扼要 的 介 
绍 。 


8 2 有关 的 数学 理论 


2.1 一 次 同 余 方程 

有 两 个 正 整 数 c .b， 若 a - ! 为 另 一 正 整数 户 的 倍数 时 ,我 们 
称 a .6 对 模 m 同 余 , 以 a 三 bCmod m) 表 之 ,这 个 概念 在 日 常生 活 的 
计算 中 常常 过 到 (如 中 国人 算 生肖 ,以 12 为 模 ), 也 为 现代 数论 研 
究 的 一 基本 工具 ,一 个 同 余 方 程 就 是 形 如 f(z) 三 0C(mod m) 的 关 
系 式 ,其 中 f 为 一 整数 系数 的 多 项 式 . 中 国人 定理 是 探讨 当 f(x) 
为 一 次 式 的 联 立 同 余 方程 组 解 的 存在 性 及 解 的 表示 ， 在 本 文 的 
应 用 中 主要 用 到 的 是 当 /(z ) 为 二 次 式 的 二 次 同 余 方程 解 的 结 
果 。 

我 们 先 举 一 个 由 二 个 一 次 同 余 方 程 组 成 的 方程 组 的 理论 作 

讨论 ， 中 国人 剩余 定理 就 可 顺理成章 地 叙述 出 来 了 。 

定理 9.1 方程 组 
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T=a(mod mi 7) 
人 (2.1) 
r=b(mod m,) 
有 解 x 的 充 要 条 件 是 m; 及 mm 的 最 大 公约 数 (m1，ms) 可 整除 
a ~5， 又 设 x。 为 方程 组 的 任意 一 个 解 ， 则 任何 其 他 解 ( 通 解 ) 可 
表 为 
r=7o。 (modim,, m,]), 
其 中 [mi ，m,] 表 m1 及 ms 的 最 小 公 倍数 ， 
证 明 ， 《 充 要 性 》 
易 见 当 ?, 为 方程 组 的 解 时 其 充 要 条 件 为 存在 有 一 整数 k, 使 
得 下 两 式 同 时 成 立 ， 
Xo =a+ km 
及 atkm,==b (modm,) 
或 a-b=hkm, (modm,) 
而 如 此 的 存在 的 充 要 条 件 为 
(m1, m2)| (a-b) (2.2) 
(这 可 由 车 m%m、n 两 整数 互 质 ， 则 必 可 找到 两 整数 x*、B， 使 
得 am + Bn=1 成 立 的 事实 得 证 )， 
现 我 们 看 通 解 部 分 ， 若 ?为 另外 解 ， 则 
Xl 三 G 三 Xo (mod mi) 
zi1=b=7x, (mod m,) (2.3) 
Zz1 一 T ,为 m1、m ,的 一 公 人 倍数。 
因此 [mi, m2])(z, 一 2) 
反之 ， 若 
Z1 三 ZiCmnodLm lm) 
则 很 明显 
X17X,=a(mod m,) 


及 zi 三 xX, 三 b(mod m,) 
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即 z, 亦 为 方程 组 的 解 。 定 理 证 毕 。 
同 理 不 难 把 上 面 定 理 推广 到 任何 多 个 同 余 方 程 组 成 的 方程 
组 而 得 到 下 面 结果 ， 
定理 9,2 同 余 方程 组 
‘Xa (modmiy) 
| “0 (mod m.,) C2.4) 
i (mod m,) 
有 解 其 充 要 条 件 为 对 任 一 对 j,kC1<j<n，1<hk<n)， 
Cmji, ms) Ca;, os) (2.5) 
且 若 x, 为 原 方 程 组 的 任意 一 个 解 ， 则 其 任何 一 个 解 可 表 为 
ZX 三 (modfmi，m,，ms,…，Mm,])， 其 中 
[mm 1 家 m1 ，m，…，m, 的 最 小 公 倍 数 。 
当 m;，m;，，…，m, 为 两 两 互 质 的 一 组 数 时 《《 即 mj;,m;) = 
1，j 专 &)， 则 由 定理 2 知 方程 组 (2.4) 总 有 解 。 于 是 就 得 到 下 面 
的 定理 ， 
定理 9.3 《〈 中 国人 剩余 定理 ) 
设 mi，m，,，…，m, 为 一 组 两 两 互 质 的 数 ， 即 (m;，m)j)= 
1， 当 ij,。 令 M=mim,…ms， 并 设 b1，6,…,5, 使 得 yj 分 别 为 
方程 


y=1(mod mj;), j=1,2,°,% 
m; 


y; 的 一 个 解 。 刚 方程 组 
“X=a1(mod m) 
| r=a,.(mod m,) 
| : 

. + 二 a,(mod m,) 
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的 通 解 为 


一 M M M 
Tab + ob Cmod M) (2.6) 


例 9,1 试 解 同 余 方 程 组 

z=5(mod 7) 

70mod 19) C2.1) 
解 : 此 时 m1 =7,，m;,=19 及 M=m, xm,=133 
:为 方程 


2 =1(mod7) 


即 19y=1(mod 7) 
的 一 个 解 y， 不 妨 取 y=3=0， 
同 理 可 得 b, = - 8 为 方程 


M 
-一 注 d 
MA 1Cmod19) 


之 一 解 ， 
于 是 原 方程 组 的 通 解 为 
三 5X57+8x(-56)103(mod 133) 
2.2 高 次 同 余 方程 
我 们 将 讨论 当 /(7) 为 整数 系数 多 项 式 时 间 余 方程 
f(x)==0(modm) (2.7) 
的 解 ， 
由 于 鞠 4 为 一 满足 方程 (2.6) 的 一 整数 解 , 则 任何 与 4 对 m 同 
余 的 数 b( 即 5 三 aCmod m)) 亦 同时 为 (2.7) 的 解 。 这 可 由 若 /Ca) 
三 0(mod m), 则 对 任何 整数 /(a+ im) 三 0(mod m)， 得 证 ,所 以 
一 般 我 们 要 知道 方程 (2.6) 有 多 少 解 ， 是 指 有 多 少 互 不 同 余 的 
解 。 我 们 将 证 明 一 般若 m 不 是 某 个 质数 的 竺 次 的 话 ， 则 一 般 解 
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方程 Fz) 拓 0(modm) 可 化 为 解 一 组 模 数 变 小 了 的 同 余 方程 . 特 
别 当 /Gz 7 可 分 解 成 线性 因子 时 ， 则 就 归 化 到 解 一 组 一 次 同 余 方 
程 ， 就 可 利用 中 国人 剩余 定理 把 通 解 求 出 来 了 。 
定理 9.4 设 /z) 为 整 系数 多 项 式 
设 M=mi ,ho 1 其 中 my00 为 两 两 
互 质 的 正 整 数 ， 则 整 0 为 方程 
f(x)=0(mod M) 
的 解 ， 其 充 要 条 件 是 为 下 列 同 余 方 程 组 之 解 ， 
/ f(x)=0(mod mi) 
| f(x)=0(mod m.,) “ 
| : 
\ fC7)=0Cmod m,) 
证 ， ”必要 性 
车 f(a) 三 0C(mod M), 则 必然 有 
f(a)=0(mod m), i=1,2,." ,7 
充分 性 ， 反 过 来 设 c 满足 
f(z)=0(mod m,), i=1,2,.", 7, 
则 f(a) 满 足下 列 方程 组 
人 4 三 0(mod Hi) 
| y=0(mod m,) 


y=0C(mod m,) 
于 是 由 定理 3( 或 2.7) 可 得 知 
fa)=0(mod mi emo m,) 
亦 即 0 为 f(x)=0C(mod M) 
的 一 解 ， 
例 9.2 设 FGz)=zs -3z4+7zs-2z:-9z+6。 试 解 
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/2%)=0(mod 165), 
解 ，'“ 165=11x5x3， 所 以 我 们 来 解 


f(x)=0C(mod 11) (2.8) 
f(x)=0C(mod 5) (2.9) 
f(z)=0(mod 3) (2.10) 


对 方程 (2.8) 而 言 ， 由 于 模 数 为 11, 故我 们 只 需 考虑 试 z= 
0,1,2,3.…,10, 看 /(X) 三 0(mod 11) 是 否 成 立 ? 得 满足 此 关系 式 
的 是 z=1，zx=6 及 x =8， 因 此 (2.8) 的 通 解 为 

7TZ 三 1(mod 11) 
=6cmod 11) | (41) 
X=8(mod 11) 
同 理 得 f(x)=0Cmod 5) 的 通 解 为 
和 三 1(mod 5) 


moad 5) (A2) 
X=3(mod 5) 
及 f(x)==0(mod 3) 的 通 解 为 
三 d 3 
f 0Cmod 3) (A3) 
zx 三 ](mod 3) 


所 以 由 通 解 (41)、(42)、(43) 的 组 合 一 共 可 得 3x3x2 
共 18 组 解 ， 如 取 任 一 组 ， 例 如 
X=1(mod 11) 
z=1(mod 5) 
2 三 0(mod 3) 
由 定理 9.3 可 得 一 解 为 z= 111, 因此 解 同时 满足 (41 一 3)， 
故 为 FCz) = 0(mod 165) 之 一 解 ， 
下 面 我 们 来 讨论 如 何 判 定 方程 /Cz) 二 0Cmod m),m 为 质数 ， 
最 多 有 几 个 不 同 余 的 解 ? 这 一 结果 在 讨论 m=px 4 两 个 不 等 的 
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质数 ， 也 是 在 我 们 电 传 打赌 将 会 用 到 的 情形 。 我 们 先 证 明 一 个 
一 般 的 结果 
定理 9.5 《〈 因 式 定理 ) 设 /(z) 为 一 非常 数 的 5 次 整 系数 多 
项 式 ， 则 整数 a 为 方程 
f(z)=0C(mod m) 
的 充 要 条 件 为 存在 一 次 数 n - 1 的 整 系数 多 项 式 g9(z) 使 得 
f(z)=(z -a)g(r) (mod m)., 
证 ， 充分 性 
车 f(x) 二 (x ~a)g(x) (mod m), 
则 f(a)=(a-a)g(a)=0 (mod m), 
必要 性 
我 们 用 长 除法 将 /Cz) 被 z -~ a 除 ， 则 可 得 一 商 式 9(z? 及 余 式 
《为 一 常数 )， 很 明显 gC7) 为 整数 系数 多 项 式 , 次 数 为 # 一 1， 及 
/为 一 整数 ， 于 是 
Fz)=( 人 -4)9Cz) +r 
当 z 一 4 时 
j(a)=(a- a)g(a) +ri=r(mod m) 
现 因 4 为 /(z) 三 0C(mod m) 之 解 ， 所 以 f(4) 三 0(mod m)。 于 是 
由 上 式 得 
7 三 0(mod m) 
因而 
f(z)=(x~ 0)9(z)Cmed m) 
定理 证 毕 。 
特别 当 上 m 为 一 质数 时 ， 我 们 不 难得 到 下 面 定理 ， 
定理 9.6 设 P 为 一 质数 ，f(X) 为 一 n 次 整数 系数 多 项 式 ， 
则 车 41，4,，、…，9, 为 1 个 属于 方程 f(z) 三 0Lmod 7 了) 的 解 , 则 必 
存在 有 一 个 n~ 1 次 的 多 项 式 gC(7)， 使 得 
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jz)=(z- or- 6) 0z-aD)9Cz)Cnod 站 
由 此 立即 可 得 以 下 推论 ， 
定理 9.7 设 p 为 一 质数 ,1(7X) 为 一 n 次 整数 系数 的 多 项 式 。 
则 f(z) 二 0Cmod p) 至 多 有 n 个 互 不 同 余 的 解 ， 


4843 二 次 同 余 方程 及 二 次 残余 的 一 些 性 质 


我 们 在 电 传 打赌 中 要 用 到 的 是 二 次 同 余 方 程 及 二 次 残余 
的 一 些 性 质 。 

定义 9.1 我 们 称 一 个 整数 4 为 一 正 整 数 m 的 二 次 残余 是 指 
(4a，m)=1 及 间 余 方程 ?三 a(mod m) 有 人 解 。 若 x? 三 a(mod m) 
无 解 ， 则 称 4 为 m 的 二 次 非 残 余 ， 

例如 ， 对 由 =11 时 6=1，3，4，5 及 9 为 其 二 次 残余 ， 但 2， 
6，7，8 及 10 就 是 六 的 二 次 非 残余 。 

一 般 可 以 证 明 对 任何 一 奇 质数 p， 在 1，2，3，…p~ 1 共 
p- 1 个 数 中 ， 一 半 是 Pp 的 二 次 残余 ， 一 半 是 Pp 的 二 次 非 残 余 ， 这 
个 事实 可 由 下 面 结果 导出 ， 

定理 9.8 设 p 为 一 奇 质数 ，a 为 一 不 被 p 整除 的 整数 ， 则 
方程 %? 三 a《mod p) 或 无 解 ， 或 有 两 个 以 p 为 模 但 不 同 余 的 解 。 

证 ， 若 x** 三 a(mod p) 有 一 解 , 设 其 为 c。， 则 我 们 不 难 验 证 
ZX 二 -Xo 为 第 二 个 与 7 不同 余 的 解 ("” 车 Xo 三 ~-xCmod p)， 
则 2zo 三 0(mod p) 壕 p 为 一 偶数 )。 

- - 玩 在 我 们 证 至 多 有 两 个 以 Pp 为 模 互 不 为 同 余 的 解 。 因 若 = 
xo 及 Y=7) 六 为 X: 三 aCmod D) 之 解 ， 则 依据 定理 9.7 知 z: 三 . 
aCmod p) 不 可 能 有 其 它 不 同 余 的 解 ， 在 我 们 判定 什么 情形 下 的 
a 及 p， 方 程 :* 三 a(mod p) 有 解 前 ， 先 引进 下 面 一 常用 的 记号 ， 
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定义 9,2 设 p 为 一 奇 质数 ，0 为 一 不 被 整除 的 整数 ， 则 勤 
兼 德 符号 ，( 忆 ) 定 义 如 下 ， 
(2)={! 车 0 为 p 的 一 二 次 残余 ， 
? “1 车 a 非 为 p 的 一 二 次 残余 ， 
换言之 〈 记 ) =- 1 表示 x 三 aCmod p) 有 解 ， 而 (也 )=- 1 
表示 xX’: 三 a(mod p) 无 解 。 
现 我 们 可 以 介绍 x 三 a(mod p) 有 解 或 无 解 的 检定 。 
定理 9,9 〈 尤 拉 检定 ) 设 p 为 一 奇 质数 ，a 为 一 不 被 p 整 除 
之 整数 ， 则 
(S$)=a "tCmod p) (2.11) 
证 , 假设 
(8)=! 
则 此 表示 方程 ?* 硅 aktmod p) 有 人 解 ， 不 妨 设 其 为 -=x。, 则 由 
费 马 小 定理 可 得 


a /2 (70 P12 1=1(mo dp) 
这 也 就 是 说 车 (也)=1 则 

(号 )=o 4mod p) 成 立 ， 
现 看 (全 ) = -1 时 如 何 ? 


这 表示 2 二 acmod D) 无 解 。 册 此 不 难 知道 对 任 一 整数 ;其 满足 1 
委 j 和 p- 1， 则 必 存 在 一 唯一 的 整数 1s<i 和 pR- 1 使 得 计 三 
acmod p) 成 立 。 因 此 我 们 可 以 把 1，2，…，P- 1 两 个 如 此 配 起 
来 ， 最 后 一 齐 相 乘 得 
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(p- TI=atoo 1 72mod p) 
由 Wilson 〈 威 尔 迁 定理) (p- 1)1 三 ~ 1Cmod p)。 此 与 上 
式 结合 得 


(5) =- 1=a'?-1) (mod p) 


因而 我 们 证 明了 不 论 (三 ) 为 1 或 ~ 1， 总 满足 (2.11)。 


注 ， 有关 惑 兼 德 记号 的 另 -- 重 要 性 质 是 

a\/b\_/ab 

(3)(T)=(3) (2.12) 
这 是 说 车 Xx: 三 a(mod px 9) 有 解 ， 则 9 为 了 及 4 的 二 次 残余 。 
电 传 打赌 中 特别 要 求 用 到 的 是 取 p 三 9 三 3Cmod 4) 的 情形 。 


定理 9,10 设 p、9 为 质数 ， 满 足 p 三 q 三 3(mod 4)， 且 7X* 三 
al(mod 7p) 及 x’: 三 a(mod 9) 有 人 解 ， 则 


7X 三 土 40‘?+ /4(mod p) 《2.13) 
及 

zr 涯 十 4‘%+1) 4(mod qa) (2.14) 
分 别 为 上 述 两 方程 之 解 。 


证 ， 因 由 假设 x 三 9Cmod p) 及 x =almod 4) 有 解 ， 记 以 
由 定理 9.9 可 得 


a (LO)= 1 
及 
a /= (TC)= 1 


了 
因此 
C+aP+l)/ 4) gat) 2~aa't "1/2=a(mod p) 


C+ 4) = / =ad'd'"-1)/2=a(mod gq) 
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验证 了 (2.13) 及 (2.14) 分 别 为 Z 三 GCCmod D) 及 z2 三 G(mod 9) 
的 解 。 

今 4atPt1A4 司 ~aiPt10/A4 及 Qt10A4 与 attt19A4 分 别 为 
方程 22=a(mod p) 及 x 三 a(mod 9) 两 起 不 同 余 的 解 , 所 以 由 中 
国人 剩余 定理 〈 定 理 9.3) 可 以 把 z:=aCmod pxq)，a 与 5.4 互 
质 ，p、4 为 奇 质 数 的 4 个 不 同 余 的 解 得 出 ,我们 可 将 以 上 分 析 
叙述 成 一 定理 如 下 ， 

定理 9,11 设 h=px9，p、4 为 两 不 等 的 奇数 并 假定 

x: 三 4(mod n)，0< 过 a 之 n 有 一 解 ，x = x,。 

则 x? 三 a(mod n)4 个 不 同 余 的 解 可 表 为 


(1) x=7xz.(mod p) (1) r=p- xmod p) 
r=7,(mod q) r=7,(mod gq) 

(1) x=z1(mod D) (W) x=p~ x,mod p) 
X=4q -7X,(mod gq) rT 三 4 ~ 7X,(mod 9) 


其 中 rz: 及 zs: 分别 满 足 zo 三 ZiCmod p)，0<X1<<P 及 zo, 二. 
Za(mod q), 0<7x,<q, 

注 ， 车 我 们 将 解 (了 及 (ID) 分别 以 x 及 y 记 之 ， 则 解 ( 政 ) 及 
( 相 ) 为 8-y 及 n~x， 则 x+y 三 2+1 才 0 (mod Dp) 及 z+y=0 
(mod 9)， 这 样 就 得 


(r+Yy, 1)=g (2.15) 
同 理 可 得 
(T+ONR-Y), 1n)=:p (2.16) 
或 (zx-y, n)=p 


这 儿 记 号 (a,0) 表 a、b 两 数 的 最 大 公约 数 ， 
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$4 打赌 步骤 


有 了 以 上 的 准备 ， 我 们 可 把 电 传 打赌 的 数学 模式 及 步骤 叙 
述 如 下 ， 

假定 有 甲 、 乙 两 方 要 借 电 传 〈 电 话 、 电 报 …》 打赌 ， 并 约 
定 由 甲 选 一 数字 ， 而 由 乙 来 猜 。 

1. 乙 先 选 两 个 很 大 而 不 等 的 质数 Pp 及 q 满 足 p=4 三 3Cmod 4) 
(注意 形 如 4k+ 3 的 质数 有 无 穷 多 的 ! )， 乙 将 p、4q 的 乘积 x( 即 
n=px4q) 先 拍 送 给 甲 方 。 

2. 甲 收 到 # 后 任 选 一 个 比 # 小 但 与 5 互 质 的 任 一 个 正 整 数 z 然 
后 计算 zx? 二 aC(mod n) 优 得 9<<a<<n〔 即 a 为 ?对 模 n 的 最 小 正 残 
余 ， 如 n=3x7=21，Zx 一 2 则 7 三 4(mod 21) 于 是 a= 4) 注意 ， 
这 里 的 z 就 是 甲 所 选 的 数字 ! 

3. 甲 将 4 拍 送 给 乙 (准备 由 乙 来 猜 了 》 

4. 乙 收 到 4 后 ， 解 方程 w* 三 a(mod pq), (这 个 方程 是 可 解 
的 ) 因 步骤 二 中 , 甲 选 的 x 就 满足 此 一 方程 ! 且 此 方程 的 解 可 由 定 
理 9.10 而 得 ， 再 依据 定理 9.11 及 其 注 可 得 解 w=Xx 或 n 一 7 及 Ww = 
y 或 n 一 y， 我 们 也 可 看 有 解 W= 土 x: 及 w= 土 y， 

5. 乙 选 土 x 或 土 y 中 之 一 拍 送 给 时 (这 是 乙 猜 的 结果 1) 

6.《I) 若 甲 收 到 的 是 x( 或 ~ 7X), 则 具有 回答 乙 说 他 猜 对 了 ， 

《IEI) 车 甲 收 到 的 是 !( 或 -2， 则 告诉 乙 说 他 猜 错 了 。 

对 于 ( 工 ) 的 情况 如 果 乙 存心 想 赢 ,他 不 会 再 去 怀疑 甲 在 骗 
他 ， 但 如 (CI) 发生 而 乙 又 不 确定 围 是 有 所 依据 而 讲 的 ， 这 是 在 
骗 他 ， 怎 么 办 ? 

下 一 步骤 是 由 乙 来 检验 甲 是 否 是 诈骗 才 需 要 的 。 (也 即 乙 
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拍 送 给 甲 的 是 土 y， 而 甲 毛 选 的 是 z， 乙 怎样 相信 甲 没 骗 他 ?) 
?7. 乙 要 求 甲 把 4 作 一 分 解 。 

， 这 时 如 甲 没 骗 乙 ， 则 甲 自己 握 有 的 数据 是 +*, 加 上 乙 拍 送 的 
y( 或 ~y) 则 由 定理 9.11 后 之 注 中 的 式 (2.15) 或 (2.16) 可 把 p 
或 9 得 出 ， 因 而 就 可 把 的 因子 p、9 都 找 出 来 。 所 以 当 甲 把 P、4 
拍 送 给 乙 ， 乙 就 只 有 认输 了 ， 因 我 们 知道 给 定 一 个 很 大 的 整数 
n， 生 知道 a 为 某 两 个 质数 的 相 乘积 ， 但 将 此 两 因子 求 出 一 般 而 
补 是 很 费时 的 。 这 也 是 电 传 打赌 公平 保证 。 

我 们 现 举 一 个 计算 的 例子 
例 9.3 假定 我 们 事先 知道 方程 z: 三 860(11021》 有 解 ， 如 


乙方 甲 《 方 
选 一 正 数 z( 只 要 比 p，G 小 ， 也 就 要 忆 


取 玉 = 103X107 | n= 11021 生 的 数 ) 


| = 11021 ?| 设 f=212， 计 站 g=x?:(modn) 
0<o<n 
| 由 x?=860(mod | 送 G= 860 | 
| 解 出 2 = 109 及 212 
| 猜 212 -| 甲 回答 忆 靖 对 了 
甲 告 诉 乙 说 他 猜 错 了 ,并 可 依据 109 及 
212 得 q = (11021，109 +212) 
| 猜 109 ,| =(11021，3x107)=107， 
国 而 了 =103 
落 乙 不 信和 甲 ， 甲 可 把 PB、4 送 已 ,就 可 
证 明 没 有 骗 人 人 了。 
图 12 
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何 来 解 此 方程 呢 ? 
解 ， 现 11021= 103x 107 〈 两 个 奇 质数 之 乘积 )， 
且 103 二 107 二 3C(mod 4) 依据 定理 10, 知 
xz2 三 860 三 36(mod 103) 及 
xX? 三 860 三 4(mod 107) 的 4 个 不 同 余 的 解 分 别 为 
7X 二 十 36'19311)14 二 二 36 三 土 6(mod 103) 及 
rz 三 十 44107+11)14 二 十 427 三 十 2(mod 107) 。 
由 此 两 联 立 方程 组 再 引用 中 国人 剩余 定理 可 得 原 方程 的 解 为 
ZX 三 十 212， 十 109(mod 11021) 
检验 ( 土 212): 二 ( 土 109)* 二 860Cmod 11021) 
利用 上 例 我 们 可 举 -- 个 打赌 的 实例 ( 见 图 12)。 


§5 研 讨 


CI) 这 样 的 打赌 有 无 失 公平 性 呢 ? 由 前 面 的 步骤 我 们 可 看 
到 甲 有 两 个 平等 的 机 会 〈 士 z 或 士 y)， 使 得 他 能 分 解 吕 《〈 收 到 的 
是 +y) 或 使 得 他 不 能 分 解 »〈 收 到 的 是 土 z-)， 忆 有 两 个 公平 的 
机 会 去 猜 中 或 没 猿 中 ， 甲 原先 定 的 z-， 所 以 该 算是 公平 的 。 

CI) 假如 围 存 心 想 输 ， 乙 有 无 法 防止 ? 

也 就 是 说 明明 乙 拍 送 给 甲 的 是 土 y， 而 不 是 土 z， 但 甲 可 装 
收 到 的 是 土 z， 而 告诉 乙 说 他 赢 了 怎 办 ? 
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第 十 章 统计 学 与 模拟 实验 


$1 统计 学 概 说 


我 们 日 常生 活 中 所 作 的 决定 都 是 根据 我 们 的 知识 与 经 验 ， 
严格 地 说 ， 知 识 也 是 前 人 的 经 验 ， 因 此 我 们 可 以 概括 的 说 ， 人 
类 之 所 以 为 万 物 之 灵 ， 在 于 人 类 能 从 经 验 中 吸取 教训 ， 进 而 对 
以 后 处 理 类 似 事件 时 的 改善 。 生 物 在 进化 过 程 中 当然 也 有 因 环 
境 而 改变 其 生存 方式 的 能 力 ， 但 这 种 能 力 是 由 于 基因 在 遗传 上 
的 改变 ， 所 以 要 历 时 很 长 久 ， 而 人 类 ， 因 有 文字 与 语言 ， 可 以 
把 经 验 在 当代 就 记录 下 来 ， 迅 速 的 传 开 ， 有 此 几 十 代 前 人 认为 
是 新 奇 的 经 验 ， 现 在 已 成 为 常识 。 像 地 球 是 圆 的 ， 某 些 疾病 可 
以 传染 ， 雷 电 不 是 雷公 、 雷 母 用 以 惩罚 不 孝 的 人 ， 这 些 都 是 前 
人 经 历 过 来 的 事实 ， 我 们 不 必 一 一 再 亲自 去 经 历 . 但 前 人 有 时 
也 会 传 下 来 一 些 不 正确 的 结论 ， 像 “ 腐 草 化 昔 "、 "乌鸦 反哺 尽 
孝 ? 等 等 , 现 已 经 经 过 仔 绍 的 观察 及 研究 之 后 而 认为 是 不 正确 的 
了 。 由 于 科学 进展 和 知识 领域 日 新 月 异 ， 我 们 不 能 只 停留 在 现 
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有 书本 上 的 知识 ,还 得 靠 一 些 书本 上 没有 的 一 一 或 是 亲身 经 历 ， 
或 是 人 们 的 故事 ， 甚 至 道听途说 一 一 来 帮助 我 们 对 一 些 新 的 事 
情 做 决定 。 

“经 验 是 最 好 的 老师 ， 只 是 学 费 太 贵 ", 如 果 我 们 想 把 我 们 
的 经 验 告诉 社会 大 众 ， 使 一 般 人 不 必 再 重复 去 经 历 而 可 得 到 我 
们 启 经 历 的 教训 ， 那 我 们 就 必须 小 心 ， 避 免 以 自己 的 经 历 而 造 
成 了 别人 的 偏见 ， 结 果 对 另 一 些 人 而 言 ， 不 但 无 益 , 反 而 有 害 。 
很 多 固执 的 长 者 往往 犯 了 这 个 毛病 ， 他 们 以 其 自身 的 经 验 作 为 
真理 ， 强 迫 他 们 的 子女 或 下 属 去 服从 。 比 如 说 ， 不 久 以 前 有 一 
位 医学 教授 声称 “ 吃 鸡 蛋 不 会 引起 胆固醇 过 多 症 ”, 他 的 理由 是 ， 
因为 他 每 天 吃 一 个 鸡蛋 ， 而 至 今 血压 不 高 , 血 中 的 胆固醇 正常 ， 
我 们 又 常 听 到 某 些 偏方 ， 像 草根 、 树 皮 ， 黄 至 香 灰 可 以 治疗 瘤 
症 ， 说 的 人 未 必 有 意 骗 人 ， 他 也 许 是 根据 他 自身 所 亲 见 的 一 个 
事实 ， 但 往往 因此 误 了 另 一 个 病人 用 正确 方法 治 病 的 时 机 。 有 
人 相信 梦 、 有 人 相信 手相 ， 这 些 事 未 必 设 有 灵验 的 时 候 ， 但 把 
一 个 有 灵验 的 例子 当 作 一 般 的 事实 来 传播 ， 常 常会 害 人 不 浅 。 
因此 当 我 们 在 宣布 一 项 新 发 现 的 时 候 ， 要 特别 慎重 ,为 了 防止 
以 一 概 全 的 错误 ， 我 们 应 有 一 套 比较 客观 的 方法 来 认识 及 解决 
周围 发 生 的 现象 ， 这 个 方法 就 是 统计 学 ， 

统计 学 的 主要 目的 在 从 一 些 样本 中 ， 推 论 某 个 假定 正确 的 
可 能 性 。 比 如 说 ， 有 一 个 人 看 见 某 个 小 孩子 天 天 看 电视 ,但 功 
课 却 很 好 ， 因 此 他 假说 “小 孩子 成 绩 好 ”, 为 了 证 实 这 个 假说 ， 
他 从 某国 随便 挑选 了 二 十 个 功课 好 的 小 朋友 及 二 十 个 功课 不 好 
的 小 朋友 ， 这 就 是 此 国 小 学 生 中 的 一 个 样本 。 结 果 他 发 现 这 二 
十 个 功课 好 的 小 朋友 平均 出 那 二 十 个 功课 不 好 的 小 明 友 电视 看 
得 多 。 那 么 现在 他 是 不 是 可 以 下 结论 说 “多 看 电视 的 小 孩子 成 
绩 好 ”了 驳 ? 这 中 间 可 有 两 个 问题 讨论 ， 
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第 一 ， 他 所 取 的 样本 的 大 小 。 四 十 个 小 孩子 够 不 够 大 ? 我 
们 不 妨 这 样 想 ， 若 他 只 取 了 一 个 功课 好 的 小 孩 及 一 个 功课 不 好 
的 小 孩 ， 他 有 没有 资格 下 上 面 所 说 的 结论 ? 你 一 定 说 没有 。 那 
么 各 二 个 呢 ? 还 没有 ? 这 样 一 直下 去 ， 他 抽 了 多 少 个 样本 才 可 
以 下 一 个 结论 呢 ? 很 显然 的 ， 这 个 问题 的 答案 不 可 能 是 一 个 数 
目 。 比 如 说 答案 是 在 二 十 个 样本 以 上 就 可 以 下 结论 ， 那 么 十 九 
与 二 十 之 间 为 什么 有 这 样 大 的 一 个 鸿沟 呢 ? 对 这 个 问题 的 一 个 
正确 的 答案 是 ， 有 多 少 样本 , 你 就 只 可 以 下 有 多 少 把 握 的 结论 
样本 愈 大 ， 就 对 结论 正确 性 的 把 握 也 就 愈 大 ， 这 个 把 握 是 以 或 
然 率 来 衡量 的 。 当 你 取 一 个 样本 的 时 候 ， 你 也 可 以 根据 样本 的 
结果 来 下 一 个 结论 ， 但 你 结论 有 50% 不 正确 的 或 然 率 ， 因 此 你 
不 便 发 表 ， 但 若 你 的 样本 够 大 ,你 的 结论 有 99% 正确 的 或 然 率 ， 
则 你 不 妨 发 表 ， 并 诚实 的 告诉 别人 的 你 结论 可 能 错误 的 或 然 率 
是 1%。 

如 何 计算 这 个 或 然 率 往往 不 是 一 个 简单 的 问题 。 古 典 统计 
学 都 是 从 解析 理论 来 寻求 计算 公式 ,但 由 于 计算 机 快速 的 发 展 ， 
或 然 事件 往往 很 容易 由 计算 机 来 模拟 (参看 本 书 第 七 章 第 3 节 )， 
我 们 将 以 统计 学 中 的 假说 检定 来 看 模拟 实验 的 应 用 。 


$ 2 假说 检定 


假说 检定 (hypothesis testing) 在 正确 表明 某 假 说 为 正确 
之 可 能 性 。 比 如 说 有 人 提出 一 个 假说 ， 

假说 ， 用 右手 写字 的 人 左 眼 视力 比 右 眼 好 。 

为 了 检定 此 一 假说 的 正确 性 ， 我 们 预备 在 某 大 学 中 随意 取 
出 100 个 用 右手 写字 的 大 学 生 ， 比 较 他 们 两 眼 的 视力 。 表 1 显示 
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Er 


了 四 种 可 能 得 到 的 抽样 结果 。 
表 1 表 中 数字 表示 在 100 人 中 左 眼 视力 较 好 的 人 数 


可 能 性 之 四 


可 能 性 之 一 | 


结 果 70 52 


z= | 
re- 
| 


”如 果 有 这 样 的 结果 ， 我 们 的 结论 是 什么 ? 在 直觉 上 ， 我 们 
很 可 能 认为 若 我 们 抽样 的 结果 是 第 一 、 二 种 情形 ， 则 可 以 认为 
假说 为 真 ， 而 在 第 三 、 四 种 情形 下 认为 假说 为 错误 〈 第 三 种 情 
形 在 直觉 上 是 眼力 相等 耐 非 较 好 ), 但 如 果 我 们 举 出 了 这 样 的 报 
告 ， 有 没有 错误 的 可 能 性 ? 当然 有 。 假 定 该 大 学 有 三 万 个 用 右 
手写 字 的 学 生 而 其 中 有 二 万 个 是 右 眼 比 左 眼 强 ， 而 另 一 万 个 是 
左 眼 比 右 眼 好 。 这 时 假说 可 以 说 是 不 成 立 的 ,但 在 100 人 抽样 中 
会 不 会 产生 表 1 中 的 各 种 可 能 性 呢 ? 都 有 可 能 。 因 此 虽然 假说 不 
成 立 ， 我 们 会 有 可 能 得 到 一 .二 的 情形 而 导 至 一 个 错误 的 结论 。 
因此 我 们 知道 在 这 种 抽样 的 情形 下 ， 我 们 对 假说 的 肯定 或 否定 
都 不 可 能 100% 的 正确 。 就 是 我 们 抽样 大 到 1000 人 ， 其 至 10000 
人 ,我 们 仍然 得 不 到 100% 正 确 的 结论 。 太 大 的 抽样 往往 花费 很 
大 ， 耗 时 很 入。 如 果 我 们 的 能 力 只 能 作 100 人 的 抽样 ， 那 么 表 : 
的 各 种 情形 对 我 们 检定 此 假说 有 无 用 处 ? 答案 是 ， 

“ 表 1 对 作 一 个 100% 正 确 的 假说 检定 可 能 无 用 ,但 它 有 时 可 
以 帮助 我 们 对 假说 做 一 个 相当 可 靠 的 检定 。” 

这 种 可 靠 性 的 计算 法 我 们 立刻 就 会 谈 到 ,但 我 们 先 把 它们 
列 在 表 1 的 第 三 行 中 ， 

从 表 2 中 我 们 可 以 看 出 我 们 对 情形 之 一 所 下 的 结论 很 有 把 
握 ， 因 为 此 结论 错误 的 或 然 率 只 有 万 分 之 一 但 在 情形 二 、 三 
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变 2 在 100 个 抽样 中 左 眼 视力 较 好 的 可 能 人 数 


情形 之 二 | 情形 之 二 | 情形 之 三 | 情形 之 四 
人 数 70 52 | 50 | 42 
暂 取 结论 假说 正确 | 假说 正确 | 假说 不 对 | 假说 不 对 
暂 取 结论 不 正确 时 ， 0.0001 0.4013 0.50 0.0548 
会 发 生 这 类 样本 的 或 


时 所 下 的 结论 就 非常 危险 ， 因 为 错误 的 可 能 性 太 高 了 ， 也 就 是 
如 果 结 论 是 如 此 得 来 的 ， 则 常常 会 错 。 我 们 自然 不 应 该 在 这 种 
情形 下 草率 地 宣布 我 们 已 知道 此 假说 的 正确 性 . 至 于 在 第 四 种 
情形 ， 因 犯错 误 的 或 然 率 不 大 不 小 ， 百 分 之 五 左右 ， 我 们 就 很 
难 决定 此 假说 的 正确 性 。 一 般 的 做 法 是 宣布 结论 并 告诉 读者 此 
结论 可 能 错误 的 可 能 性 ， 让 读者 心理 有 一 个 准备 

要 看 表 2 中 几 个 或 然 率 是 怎么 算出 来 的 ,我 们 先 从 简单 的 例 
子 想 起 。 假 定 一 个 竹子 里 有 黑 球 与 白 球 ， 且 数目 很 大 ， 但 黑白 
之 比例 我 们 不 知道 。 设 假说 是 ， 

假说 ， 和 袋 中 黑 球 多 于 白 球 。 

为 了 检定 此 假说 的 正确 性 ,我 们 将 取出 ?个 球 作 观 察 。 先 令 
n=1， 即 取出 一 球 ， 假 定 此 球 为 黑色 。 若 我 们 据 此 声称 假说 为 
正确 ， 那 么 我 们 的 声称 发 生 错误 的 或 然 率 是 多 少 ? 令 

P= 筑 中 黑 球 之 比例 ， 
则 了 到 一 球 而 得 一 黑 球 之 或 然 率 为 p, 若 p 生 0.5， 则 我 们 的 结论 发 
生 错 误 , 因 此 “在 假说 不 正确 的 情形 下 ,我 们 有 Pp 的 或 然 率 得 到 一 
个 这 样 的 样本 而 下 了 一 个 错误 的 结论 ”。P 是 未 知 数 ， 但 可 高 达 
0.5， 故 我 们 说 我 们 的 结论 错误 的 或 然 率 可 以 高 达 0.5《〈 但 不 会 
高 过 0.5， 因 p>>0,.5 时 ,假说 就 正确 了 )。“ 结 论 错 误 的 或 然 率 ” 
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这 个 词句 可 能 引起 误会 , 它 不 是 指 这 次 结论 发 生 错误 的 或 然 率 ” 
因为 袋 中 的 球 是 一 定 的 ,假说 对 不 对 也 是 一 定 的 。 因 此 声称 “ 假 
说 正确 ”这 件 事 非 对 即 错 ， 没 有 或 然 率 而 言 ,“ 结 论 错误 的 或 然 
率 可 以 高 达 0.5" 这 句 话 的 意思 是 ， 

我 们 若 以 目前 这 种 态度 下 结论 〈 即 取 一 球 ， 得 一 黑 球 则 宣 
布袋 中 黑 球 多 于 白 球 )， 我 们 所 有 的 结论 中 ,可 以 高 达 一 半 是 错 
误 的 ，。 

再 把 这 个 问题 换 一 个 角度 看 。 假 定 我 们 得 到 了 一 个 白 球 ， 
我 们 仍 宣称 假说 “ 袋 中 黑 款 多 于 和 白 球 ”正确 ， 我 们 结论 错误 的 
或 然 率 是 多 少 ? 在 这 种 情形 下 ， 我 们 得 到 这 样 样本 的 或 然 率 是 
1--p， 在 p< 生 0.5 的 情形 下 ,1 - pg 可 以 高 达 1， 因此 我 们 结论 错误 
的 或 然 率 可 以 高 达 1。 我 们 再 强调 一 遍 , 这 并 不 是 这 次 决定 错误 
的 或 然 率 是 1 或 高 达 1， 因 这 次 对 不 对 已 经 定 了 ， 而 是 ， 

我 们 车 以 目前 这 种 态度 下 结论 〈 即 取 一 妹 ， 看 到 了 白 球 ， 
仍 宣布 黑 球 多 的 假说 成 立 )， 我 们 所 有 的 结论 可 以 全 是 错 的 。 

这 是 很 显然 的 ， 因 为 这 种 几乎 是 不 看 事实 下 结论 〈 看 到 和 白 
球 仍 说 黑 球 多 )， 自 然 可 能 全 错 ， 

现在 假定 n=2。 即 取 2 球 ， 因 袋 中 的 球 极 多 ,我 们 可 以 用 二 
项 展开 式 来 计算 取出 球 各 种 情形 的 或 然 率 。 现 假定 取出 的 两 个 
球 都 是 黑 球 ， 如 果 因 此 我 们 认定 假说 成 立 ， 则 可 能 发 生 错误 的 
或 然 率 是 在 p<0,5 时 得 两 个 黑 球 的 或 然 率 ， 即 | 

=p〈 在 二 样本 中 得 两 个 黑 球 |p 志 0.5)。 
在 上 式 中 的 “|” 号 表示 已 知 右 式 p 所 0.5 成 立 。 若 再 以 表示 2 
球 中 黑 球 的 数目 ， 则 上 式 成 为 

a=p(X=2|pE0.5)=p; p<0,.5 
上 式 的 可 以 达到 0.5=0.25， 即 


a=p: 去 0.25 
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且 可 以 等 于 0.25。 也 就 是 说 在 这 种 情形 下 宣布 假说 p>>0.5 成 立 
造成 错误 的 或 然 率 不 会 大 于 0.25， 但 可 以 高 达 0.25。 
再 往 下 看 ， 若 任意 取 10 个 球 全 都 是 黑 球 ， 那 么 我 们 可 能 错 
误 的 或 然 率 就 变 成 ， 
&X=p(X=-101D 委 0.5) 
依 前 法 可 得 
4=pI2<0.5:0=0.000976 鳃 0.001 (1) 


即 在 这 种 情形 下 宣布 假说 p 之 0.5 成 立 发 生 错 误 之 可 能 性 不 大 于 
0.001, 至 多 也 只 有 0.001, 即 千 分 之 一 ,我 们 应 可 以 宣布 pD>0.5 
成 立 。 

现在 还 剩 下 一 个 问题 ， 即 如 果 10 个 球 中 是 9 黑 1 白 ， 我 们 若 
结论 假说 p>0.5 成 立 ， 则 此 结论 错误 之 或 然 率 是 多 少 ? 这 就 触 
及 统计 学 较 深 一 层 的 理论 ,前 面谈 过 当 我 们 说 “我 们 宣布 p>0.5 
成 立 ， 而 可 能 错误 之 或 然 率 为 0.001” 这 和 句 话 时 ,其实 它 的 含义 
与 字面 稍 有 不 同 。 我 们 再 强调 一 次 这 个 常常 引起 误解 的 观念 ， 
当 我 们 宣布 之 0 .5 成 立时 ， 我 们 是 否 正确 或 错误 已 经 定 了 (但 
我 们 不 知道 )， 因 弘 中 的 黑 球 与 白 球 是 一 定 的 ,是 不 是 p 之 0.5 也 
是 一 定 的 。 因 此 我 们 可 能 错误 的 或 然 率 是 0.001 是 指 : 在 一 千 次 
这 样 的 决定 中 ， 可 能 有 一 次 是 错 的 。 因 此 当 我 们 在 做 决定 时 ， 
我 们 所 持 的 不 单 是 这 一 次 的 决定 ， 而 是 指 所 有 其 他 类 似 这 样 的 
决定 。 因 此 我 们 如 果 在 10 个 球 中 有 9 黑 1 白 就 宣布 假说 p 之 0.5 成 
立 ， 则 下 次 如 果 在 10 球 中 有 10 黑 0 白 ， 我 们 一 定 也 会 宣布 假说 
p>0.5 成 立 。 因 此 我 们 在 9 黑 1 白 宣布 假说 p 之 0.5 成 立 ， 其 实 是 
指 ， 若 在 10 球 中 ， 黑 球 多 于 或 等 于 9 个 ,宣布 假说 成 立 。 因 此 在 
此 情形 下 可 能 造成 错误 的 或 然 率 是 

a=p(X>I91p<0.5), X~b(10,7) 
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= pt (1 )pG1-DI=pD+10-D) 
=p(10 ~ 97) (2) 
很 显然 由 微分 可 知 g 之 极点 在 p=0,1, 故 在 p 和 0.5 时 % 之 极 大 值 
为 
2<0.58(10-9x0.5)=0.011 
故 在 此 情形 下 最 大 错误 的 或 然 率 也 不 过 是 百 分 之 一 。 是 否 
接受 此 假说 ， 则 要 看 此 结论 之 重要 性 ， 车 此 假说 与 千 万 人 生命 
有 关 ， 则 此 错误 之 或 然 率 仍 嫌 太 大 。 故 此 在 发 表 论 文 时 ， 一 般 
著者 都 附 上 此 假说 是 在 何 种 可 能 错误 的 或 然 率 下 接受 的 ， 因 为 
使 用 同一 结果 的 别人 ， 可 能 需要 不 同 程度 的 保证 。 
再 往 下 看 ， 若 在 10 球 中 所 得 为 8 黑 2 白 ， 则 同 理 可 得 
a=p(X>81p<0.5), X~b(10,p) 
= pi°+ (pd -p+ (0)p*C1 ~p)? 
<(l+10+45)x0.5!°=0.055 (3) 
且 可 高 达 0.055。 
现在 可 以 回 到 表 2 中 的 或 然 率 了 。 我 们 且 取 第 一 种 情形 为 
例 。 设 习 为 100 个 人 中 左 眼 较 好 的 人 数 ，z 为 左 眼 较 好 者 在 母体 
中 的 比例 ， 则 在 第 一 种 情形 下 接受 p2>0.5 发 生 错误 之 或 然 率 为 
a=p(X>70|p<0.5) 
<p(X>70|p= 0.5) 


_ 190 100 00 
二 ( 70 /0.5) 
<0.0001 (4) 
表 2 中 其 他 几 个 或 然 率 之 值 也 可 依法 求 出 ， 


现在 我 们 可 以 看 到 假说 检定 的 程序 是 
1. 你 想 证 实 的 假说 (一般 以 H,. 表 示 )， 和 当 你 假说 不 对 时 ， 
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我 们 以 瓦 。 表 示 : ， 对 黑白 球 的 例子 而 请， 

形 。， 袋 中 景 球 比 白 球 多 〈P>>0.5) 

H,; P<0.5 

2. 取 一 个 合理 的 判别 法 。 在 黑白 球 问题 中 ， 如 果 抽 样 中 黑 
球 太 多 时 ， 即 可 宣称 H. 为 正确 。 什 么 是 太 多 则 要 由 2 来 决定 , 即 
求 出 : 1 

3. 若 在 目前 的 情形 下 宣称 H, 成 立时 所 可 能 错误 的 或 然 率 
《也 可 称 为 所 冒 之 风险 ， 通 常 以 c 表 示 :)。 

读者 可 以 看 出 前 面 (1 一 4) 等 式 全 是 由 止 面 三 个 程序 所 导 
引出 来 的 。 

但 要 求 出 a 并 不 都 像 《1 一 4》 式 那样 容易 ， 今 再 举 一 例 , 设 
某 种 汽车 有 六 种 颜色 ， 白 ， 红 ， 橙 ， 黄 ， 灰 ， 蓝 ， 今 在 某 地 各 
色 之 销售 量 分 别 为 15，5，6，16，9，9 辆 ， 试 问 我 们 可 和 否 确 定 
人 们 对 各 色 需 要 的 出 例 不 同 。 依 假说 检定 之 程序 ， 

1.8。 人 们 对 各 色 之 需求 比例 相同 ， 

H,， 人 们 对 各 色 之 需求 比例 不 相同 。 | 

2. 我 们 取 H, 若 各 色 之 要 求 量 相差 太 大 ;以 公式 表示 的 方法 

之 一 为 *， | | | 


QO= 2 10,-n/6l>e (5) 


式 中 o 为 各 色 之 销售 量 ，? 为 全 部 周 量 60，IW 6 三 10 表 示 若 在 及 
的 情形 下 o, 景 可 能 之 值 。 因 此 若 o, 与 10 相 差 太 多 ， 则 也 。 不 会 成 
立 了 。 
3 .现在 要 求 在 五 的 情形 ， 
p( 工 lo -lol>o) (6) 


而 式 中 e 为 现今 之 0 值 即 22。 车 用 解析 数学 , C6》 非常 不 容易 计 
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算 ， 但 若 用 模拟 实验 ， 在 也 成立 的 情形 下 ， 反 复 取 60 球 看 Q 之 
值 有 多 少 机 会 大 于 22。 我 们 实际 上 取 了 1000 次 模拟 取样 实验 ， 
所 得 到 的 结果 是 


8 
a=7,{ 3 lo ~101>221H,)=0.05 
日 上 


因此 种 c 位 于 临界 点 ， 最 好 是 将 结果 与 "同时 公布 给 使 用 者 。 
现在 回 过 来 谈 一 下 模拟 取样 的 方法 . 因 在 五 成 立 的 情形 下 ， 


各 色 汽 车 需求 相同 ， 因 此 我 们 每 取 一 辆 泊 车 ， 分 别 以 二 的 机 会 


令 它 为 六 色 中 之 一 种 。 那 么 在 60 辆 汽车 抽 完 之 后 ， 我 们 会 有 一 
个 “在 各 色 和 需求 相同 情形 下 即 H,)” 的 一 个 可 能 发 生 的 样本 。 
若 结 果 是 10，12，14，16，3，5， 则 8=24， 也 就 是 说 在 H, 成 
立 是 8 有 可 能 是 24， 但 可 能 性 的 大 小 则 必须 再 多 抽样 。 我 们 如 
此 做 了 一 千 次 ,发 现 有 52 次 8 宇 22， 因 此 我 们 知道 P,{8 宇 22} 的 
机 会 约 为 千 分 之 52， 即 0.05。 

再 举 一 个 例子 ， 设 有 某 种 新 教学 法 ， 想 与 传统 的 方法 相 比 
较 。 现 对 二 套 教学 法 各 取 了 四 个 程度 相当 的 班级 。 在 用 同样 的 
时 间 材 料 教授 之 后 ， 做 一 次 会 考 ， 成 绩 如 下 案 


表 3 
新 方法 (4 班 》 72(Xx1)，64(X2)，68(Xs)，76(Xs); 平 均 (%)=70 


旧 方 法 (4 班 ) 60(yi1)，64(y2)，70 (ys)，78(y4); 平均 ( 引 ) =68 


试问 我 们 可 否 下 结论 新 方法 教学 效果 较 好 ? 依 假说 检定 之 法 则 ， 
1. 我 们 若 以 H 1 表示 新 方法 使 用 后 全 国 各 班 的 平均 成 绩 , 而 
互 为 旧 方 法 的 平均 成 绩 ， 则 
H,:H, <H,, 而 FH,:H, >H,. 
2. 我 们 的 决策 方法 自然 是 车 3 比 3 大 得 多 ， 则 取 H,， 现 在 2 
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比 3 大 2， 算 不 算 多 呢 ? 
3. 我 们 车 在 目前 的 情形 下 取 昌 H,， 则 错误 的 或 然 率 是 
ua=7,{7 ~ y>2|H,} (7) 
上 式 是 指 当 理 ,成 立时 ， 我 们 若 各 取 4 班 ,他 们 会 有 多 少 机 会 
产生 大 于 2 的 平均 差 。 
要 计算 (7) 的 或 然 率 相当 不 容易 ， 甚 至 无 从 下 手 " 。 但 若 从 
模拟 实验 的 观点 来 看 ， 因 在 HH, = 日, 时 < 最 大 ， 故 
Q=pD,(5 -9>2IH,}<p {2-22IH=H,} (8) 
又 因 在 H, =H; 时 ， 成 绩 已 与 教学 法 无 关 ， 故 这 八 个 数据 其 实 是 
从 同样 的 教 法 得 出 来 的 。z:，zs，zs，z4 可 以 是 其 中 任何 四 个 
数 。 因 此 (8) 式 所 要 求 的 是 , 若 我 们 从 这 八 个 数 中 任 取 4 个 做 zl， 
22，7s， 74， 而 另 四 个 做 yi:，ya，ys ,yo 有 多 少 可 能 地 -8 之 2? 
这 样 的 实验 很 容易 做 ,经 不 断 反 复 抽样 可 得 a 关 0.36, 因 此 ,我 们 
车 以 目前 的 数据 来 宣布 新 方法 较 好 ， 可 以 有 高 达 0.36 错 误 的 或 
然 率 ， 似 嫌 草 率 ， 


由 于 计算 机 的 进展 ， 许 多 困难 的 统计 问题 都 可 以 以 模拟 抽 
样 的 方式 得 到 解决 ， 

注 1 

当 我 们 作 统计 性 的 结论 的 时 候 ， 要 特别 小 心 我 们 样本 中 所 
含 的 结论 是 不 是 我 们 文字 所 表示 的 意 轧 。 像 现在 所 谈 的 功课 好 
的 小 孩子 电视 看 得 多 ， 可 以 有 以 下 几 种 结论 ， 

1. 电视 看 得 多 的 小 孩子 功课 好 ， 

2 ,功课 好 的 孩子 有 多 的 时 间 看 电视 。 
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3. 人 允许 小 孩子 多 看 电视 的 家 庭 出 功课 好 的 孩子 。 
而 这 三 种 结果 对 一 般 人 所 产生 的 效果 可 能 不 同 ， 第 一 种 结论 好 
像 是 说 看 电视 会 使 得 功课 好 ;第 二 种 结论 就 完全 没有 这 种 意味 
第 三 种 结论 是 指 家 庭 的 教育 方式 或 富裕 的 情形 是 功课 好 与 看 电 
视 的 公 因子 。 而 上 面 结论 何 考 为 正确 ， 不 是 从 以 上 四 十 个 样本 
只 调查 功课 好 坏 及 看 电视 多 少 可 以 决定 的 。 因 此 当 我 们 抽 完 样 
本 之 后 的 正确 结论 只 可 能 是 ， 

看 电视 多 少 与 功课 好 有 正 的 相关 性 
以 上 的 结论 正确 的 或 然 率 不 小 于 某 个 百分比 ， 上 结论 中 的 “ 正 
相关 ”的 意思 是 指 看 电视 与 成 绩 高 低 有 同 升 同 降 的 关系 。 

注 2 丸 , 又 命名 为 对 立 假设 (alternative hypothesis) 而 H。 
为 虚无 假设 null hypothesis)， 

注 3 也 可 以 称 之 为 pg 一 value 。 在 近代 统计 学 中 wx 与 p 一 
value 含 义 不 完 全 相同 ， 但 因 牵 涉 太 广 ， 不 能 在 此 申论 

注 4 对 这 个 问题 的 合理 决策 可 以 用 好 几 种 ,可 以 是 文中 的 


Q， 但 也 可 以 用 汇 (o,~ n/6 ) (平方 差 ) 或 max(o) -min C01) 


《绝对 差 )， 但 用 模拟 法 求 < 尼 极 相似 〈 但 解析 法 则 相差 极 大 ， 甚 
至 不 知 如 何 去 解 )， 

注 5 传统 的 方法 是 假定 x; 与 的 分 布 是 常态 分 布 ， 然 后 推 
导出 或 然 率 ， 即 所 谓 的 t 一 test， 或 具 用 大 小 的 次 序 ， 即 所 谓 的 


nonparametric test, 
附注 


本 文中 的 一 部 分 系 取材 于 本 文 著者 所 著 * 现 代 应 用 数学 一 
书 。 
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编 后 记 


1989 年 夏 ， 国 内 一 些 数学 家 和 湖南 教育 出 版 社 编辑 同志 在 
南开 大 学 和 北京 大 学 聚合 ， 深 深 感 到 “当今 数学 的 面 鲍 日 新 月 
异 ， 数 学 的 功能 正在 向 其 他 自然 科学 、 工 程 技术 甚至 社会 科学 
领域 扩展 和 渗 和 得， 数学 本 身 在 强大 的 社会 要 求 和 内 部 动力 的 推 
动 下 ， 不 断 追 求 自身 的 发 展 和 完美 ”, 项 望 能 组 织 各 方面 专家 编 
写 一 批 书籍 “在 中 学 数学 的 基础 上 ， 用 现代 观点 向 高 中 生 、 中 
学 教师 、 大 学 生 、 工 程 技术 人 员 、 自 然 科学 和 社会 科学 工作 者 
以 及 一 切 数 学 爱好 者 介绍 一 些 数学 思想 ， 使 大 家 真正 地 认识 数 
学 ， 了 解数 学 ， 热 次 数学 ， 走 向 数学 ,这 就 是 “走向 数学 ?丛书 
的 起 源 。 我 们 商定 这 套 通 俗 读物 的 宗旨 是 ,;“ 用 浅显 易 懂 的 语言 
从 各 个 方面 和 角度 向 读者 展示 一 些 重 要 的 数学 思想 ， 讲 述 数 学 
(尤其 是 现代 数学 ) 的 重要 发 展 ， 介 绍 数 学 新 兴 领 域 、 数 学 的 广 
泛 应 用 以 及 数学 史上 主要 数学 家 (包括 我 国 数学 家 ) 的 成 就 。? 
由 于 数学 界 大 力 支持 “数学 天 元 项 目 ” 的 赞助 和 各 方面 热 
情 协 助 ， 一 年 后 ,第 一 辑 八 本 书 已 与 读者 见面 ,第 二 辑 也 即将 出 
版 。 这 十 六 本 书 尽管 深浅 不 同 ， 风 格 各 异 ， 但 至 少 有 一 个 共同 
之 处 ， 即 作者 们 均 朝 着 本 丛书 的 宗旨 和 目标 作 了 认真 的 努力 。 
在 这 批 书 中 ， 作 者 们 介绍 了 近年 来 数学 一 些 重要 发 展 和 新 
的 方向 (其 中 包括 1990 年 费 尔 兹 奖 获得 者 V,Jones 在 拒 扑 学 弓 结 
理论 方面 的 杰出 工作 ， 拓 站 学 家 Kuhn 和 Smale 在 数值 复杂 性 方 
面 的 开创 性 工作 ， 实 动力 系统 的 黄 基 性 结果 等 )， 以 中 学 数学 为 
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起 点 介绍 一 些 数学 分 支 和 课题 (如 复 济 数 、 非 欧 几 何 , 有 限 域 、 
山竹、 拉 姆 案 理 论 、Polya 计 数 技 术 等 )， 通 注 具 体 实例 引伸 出 
重要 的 数学 思想 和 方法 〈 如 数论 在 数值 计算 中 的 应 用 ， 几 何 学 
的 近代 观点 ， 群 在 集合 上 的 作用 ， 计 算 的 复杂 性 概念 等 ), 从 不 
同 的 侧面 介绍 了 数学 在 物理 、 化 学 、 经 济 学 、 信 息 科学 以 及 工 
农业 生产 等 方面 的 广泛 应 用 ， 刀 持 华 罗 庚 教授 多 年 来 在 中 国 普 
及 数学 方法 的 宝贵 经 验 。 在 节 的 正文 或 附录 中 ， 作 者 们 介绍 了 
中 外 许多 数学 家 的 生平 和 业绩 。 特 别 是 国内 外 数学 家 为 华罗庚 
教授 所 写 的 纪念 文章 ， 从 不 同 侧面 回忆 了 他 早年 的 业绩 ， 赞 扬 
他 为 新 中 国 培养 人 材 和 热爱 祖国 献身 事业 的 可 贵 精神 ， 这 对 于 
我 们 〈 包 括 年 轻 一 代 》 是 有 很 大 教育 意义 的 ， 

尽管 作者 们 作 了 很 大 的 努力 ， 但 我 们 深 知 ， 用 通俗 语言 介 
绍 如 此 丰富 的 数学 思想 和 飞跃 的 发 展 , 是 一 项 十 分 艰难 的 任务 。 
在 第 一 批 书 出 版 之 后 ,我 们 热 访 地 欢迎 广大 读者 的 批评 和 意见 ， 
以 利于 今后 改进 和 提高 。 如 前 所 述 ， 这 批 节 的 写作 风格 各 异 ， 
取材 的 深度 和 广度 也 有 所 差别 。 即 使 不 少 作者 几 允 其 稿 ， 力 图 
把 基点 放 在 初等 数学 ， 但 是 要 介绍 现代 数学 的 思想 和 内 容 ， 很 
难 避 免 引 进深 一 层 的 概念 和 方法 。 所 以 ， 我 们 不 能 苛求 读者 在 
最 初 几 遍 就 能 把 书 中 叙述 的 内 容 和 体现 的 思想 方法 全 部 读 懂 ， 
但 是 希望 具有 不 同 程度 数学 知识 和 修养 的 数学 党 好 者 在 认真 读 
过 这 些 书 之 后 都 能 有 所 收获 ， 开 闽 眼界， 增长 见识 ， 从 而 更 加 
认识 数学 ， 了 解数 学 ， 热 爱 数学 和 走向 数学 。 


冯 克 散 


识 于 一 九 九 二 年 五 月 。 
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